https://pytroubles.com/hi/posts/id1106-plotly-sankey-men-sttiik-nodd-snrekhnn-y-kendr-se-vyaavhaarik-gaaidd

Plotly Sankey में सटीक नोड संरेखण: Y केंद्र से व्यावहारिक गाइड

Sankey चार्ट में Y पोज़िशन से नोड संरेखण: Plotly + Python का सरल तरीका

Plotly Sankey में सटीक नोड संरेखण: Y केंद्र से व्यावहारिक गाइड

Plotly Sankey में fixed arrangement पर Y केंद्र प्रवाह से कैसे निकालें: संचयी चौड़ाई आधारित संरेखण, श्रेणी क्रम की स्थिरता, और Python कोड उदाहरण; सटीक लिंक प्लेसमेंट.

2025-10-20T00:33:10+03:00

सैंकी डायग्राम को “सही” दिखाने की कुंजी रंगों और लेबलों से कम, और ज्यामिति से ज्यादा जुड़ी है। अगर किसी कॉलम में नोड्स उस कुल प्रवाह के साथ सीध में नहीं आते जिसे वे दर्शाते हैं, तो पूरा चार्ट असंतुलित लगता है। असली बात यह है कि नोड की ऊर्ध्वाधर स्थिति उसके केंद्र से तय होती है, शीर्ष से नहीं; इसलिए y निर्देशांकों को हाथ से चुनना अक्सर असंतुलन पैदा करता है। नीचे दो-स्तंभीय सैंकी में समेकित प्रवाह के आधार पर Y निकालकर नोड्स को ठीक तरह से संरेखित करने की संक्षिप्त प्रक्रिया दी गई है।समस्या की रूपरेखा और न्यूनतम पुनरुत्पाद्य स्निपेटडायग्राम में बाएँ और दाएँ नोड्स के लिए स्थिर अवस्थाएँ इस्तेमाल की गई हैं। श्रेणियाँ क्रमबद्ध हैं और दोनों पक्षों पर दोहराई गई हैं, लिंक अपने स्रोत के रंग में हैं, और x/y हाथ से दिए गए हैं। यही मैनुअल y प्लेसमेंट दृश्य असंतुलन का कारण बनता है।import pandas as pd import plotly.graph_objects as go from io import StringIO # डेटा लोड करें csv_buf = StringIO(""" from_cat,to_cat,percent rpf,bp,3.55314197051978 rpf,cc,6.19084561675718 rpf,es,1.21024049650892 rpf,ic,2.46702870442203 rpf,rpf,2.26532195500388 rpf,sc,6.54771140418929 bp,bp,0.977501939487975 bp,cc,0.403413498836307 bp,es,0.108611326609775 bp,ic,4.7944142746315 bp,rpf,0.387897595034911 bp,sc,1.81536074476338 ic,bp,0.124127230411171 ic,cc,0.21722265321955 ic,es,0.0155159038013964 ic,ic,0.170674941815361 ic,rpf,0.0155159038013964 ic,sc,0.294802172226532 cc,bp,1.25678820791311 cc,cc,7.50969743987587 cc,es,9.41815360744763 cc,ic,0.775795190069822 cc,rpf,1.05508145849496 cc,sc,20.8068269976726 cc,sr,0.0465477114041893 sc,bp,0.0155159038013964 sc,cc,0.325833979829325 sc,es,1.92397207137316 sc,rpf,0.0155159038013964 sc,sc,4.43754848719938 sr,bp,0.0620636152055857 sr,cc,1.55159038013964 sr,es,5.10473235065943 sr,ic,0.0155159038013964 sr,rpf,0.0155159038013964 sr,sc,9.71295577967417 sr,sr,0.0775795190069822 es,bp,0.108611326609775 es,cc,0.574088440651668 es,es,1.48952676493406 es,ic,0.0310318076027929 es,rpf,0.0620636152055857 es,sc,2.00155159038014 es,sr,0.0465477114041893 """) frame = pd.read_csv(csv_buf, skipinitialspace=True) # श्रेणियों का क्रम tier_order = ["es", "sr", "sc", "cc", "ic", "bp", "rpf"] frame["from_cat"] = pd.Categorical(frame["from_cat"], categories=tier_order, ordered=True) frame["to_cat"] = pd.Categorical(frame["to_cat"], categories=tier_order, ordered=True) # निर्धारक क्रम frame = frame.sort_values(["from_cat", "to_cat"]).reset_index(drop=True) # बाएँ/दाएँ लेबल और इंडेक्स left_tiers = tier_order right_tiers = tier_order node_labels = [f"{c} (L)" for c in left_tiers] + [f"{c} (R)" for c in right_tiers] label_to_id = {lbl: i for i, lbl in enumerate(node_labels)} frame["src_id"] = frame["from_cat"].map(lambda c: label_to_id.get(f"{c} (L)", -1)) frame["dst_id"] = frame["to_cat"].map(lambda c: label_to_id.get(f"{c} (R)", -1)) frame["src_id"] = pd.to_numeric(frame["src_id"], downcast="integer", errors="coerce").fillna(-1).astype(int) frame["dst_id"] = pd.to_numeric(frame["dst_id"], downcast="integer", errors="coerce").fillna(-1).astype(int) # रंग COLOR_BY_GROUP = { "es": "#F6C57A", "sr": "#A6D8F0", "sc": "#7BDCB5", "cc": "#FFC20A", "ic": "#88BDE6", "bp": "#F4A582", "rpf": "#DDA0DD", "Unknown": "#D3D3D3" } node_fill = [COLOR_BY_GROUP[c] for c in left_tiers] + [COLOR_BY_GROUP[c] for c in right_tiers] link_fill = [node_fill[s] for s in frame["src_id"].tolist()] # मैनुअल पोज़िशन (y का समस्या‑जनक स्थान) x_pos = [ 0.001, 0.001, 0.001, 0.001, 0.001, 0.001, 0.001, 0.999, 0.999, 0.999, 0.999, 0.999, 0.999, 0.999 ] y_pos = [ 0.05, 0.18, 0.31, 0.44, 0.57, 0.70, 0.83, 0.05, 0.18, 0.31, 0.44, 0.57, 0.70, 0.83 ] chart = go.Figure(go.Sankey( arrangement="fixed", node=dict( pad=40, thickness=25, line=dict(color="black", width=0.5), label=node_labels, x=x_pos, y=y_pos, color=node_fill ), link=dict( source=frame["src_id"].tolist(), target=frame["dst_id"].tolist(), value=frame["percent"].tolist(), color=link_fill, hovertemplate="%{source.label} → %{target.label} %{value:.2f}%<extra></extra>" ), valueformat=".2f", valuesuffix="%" )) chart.update_layout( title="Flow", font_size=12, paper_bgcolor="#f7f7f7", plot_bgcolor="#f7f7f7", margin=dict(l=30, r=30, t=60, b=30), width=1000, height=800 ) chart.show() क्या और क्यों गड़बड़ होता हैजब Sankey में arrangement को fixed रखा जाता है, तो Y नोड के केंद्र का ऊर्ध्वाधर निर्देशांक होता है। नोड्स को बराबर दूरी पर रखना उनके वास्तविक कुल चौड़ाई को अनदेखा करता है; नतीजतन, चौड़े नोड का केंद्र उस प्रवाह की तुलना में खिसक जाता है जिसे वह दर्शाता है। इसलिए लिंक थोड़ा तिरछे या गुच्छेदार दिखते हैं। ठीक से लाइन‑अप करने के लिए Y को हर कॉलम में कुल चौड़ाइयों के संचयी वितरण से निकालना चाहिए: सभी पिछले नोड्स की चौड़ाइयों को जोड़ें और वर्तमान नोड की आधी चौड़ाई जोड़कर केंद्र पाइए। अंत में, इन मानों को [0, 1] कैनवास दायरे में सामान्यीकृत करें।डेटा को श्रेणीबद्ध और स्पष्ट रूप से क्रमबद्ध किया गया है, और निर्धारक sort रन दर रन from_cat और to_cat के दृश्य क्रम को स्थिर रखता है। जब आप गणना किए गए पोज़िशन को लेबल और रंगों से जोड़ते हैं, तो यह स्थिरता मायने रखती है।समाधान और संरेखित संस्करणदृष्टिकोण सीधा है: बाएँ कॉलम और दाएँ कॉलम के लिए प्रति श्रेणी प्रवाह को समेकित करें, संचयी केंद्र निकालें, और उन्हें Y के रूप में उपयोग करें। X पोज़िशन किनारों पर ही रहते हैं। एक सहायक तालिका गणना को सरल बनाती है।import pandas as pd import plotly.graph_objects as go from io import StringIO # डेटा लोड करें csv_buf = StringIO(""" from_cat,to_cat,percent rpf,bp,3.55314197051978 rpf,cc,6.19084561675718 rpf,es,1.21024049650892 rpf,ic,2.46702870442203 rpf,rpf,2.26532195500388 rpf,sc,6.54771140418929 bp,bp,0.977501939487975 bp,cc,0.403413498836307 bp,es,0.108611326609775 bp,ic,4.7944142746315 bp,rpf,0.387897595034911 bp,sc,1.81536074476338 ic,bp,0.124127230411171 ic,cc,0.21722265321955 ic,es,0.0155159038013964 ic,ic,0.170674941815361 ic,rpf,0.0155159038013964 ic,sc,0.294802172226532 cc,bp,1.25678820791311 cc,cc,7.50969743987587 cc,es,9.41815360744763 cc,ic,0.775795190069822 cc,rpf,1.05508145849496 cc,sc,20.8068269976726 cc,sr,0.0465477114041893 sc,bp,0.0155159038013964 sc,cc,0.325833979829325 sc,es,1.92397207137316 sc,rpf,0.0155159038013964 sc,sc,4.43754848719938 sr,bp,0.0620636152055857 sr,cc,1.55159038013964 sr,es,5.10473235065943 sr,ic,0.0155159038013964 sr,rpf,0.0155159038013964 sr,sc,9.71295577967417 sr,sr,0.0775795190069822 es,bp,0.108611326609775 es,cc,0.574088440651668 es,es,1.48952676493406 es,ic,0.0310318076027929 es,rpf,0.0620636152055857 es,sc,2.00155159038014 es,sr,0.0465477114041893 """) frame = pd.read_csv(csv_buf, skipinitialspace=True) # श्रेणियों का क्रम tier_order = ["es", "sr", "sc", "cc", "ic", "bp", "rpf"] frame["from_cat"] = pd.Categorical(frame["from_cat"], categories=tier_order, ordered=True) frame["to_cat"] = pd.Categorical(frame["to_cat"], categories=tier_order, ordered=True) # निर्धारक क्रम frame = frame.sort_values(["from_cat", "to_cat"]).reset_index(drop=True) # बाएँ/दाएँ लेबल और इंडेक्स left_tiers = tier_order right_tiers = tier_order node_labels = [f"{c} (L)" for c in left_tiers] + [f"{c} (R)" for c in right_tiers] label_to_id = {lbl: i for i, lbl in enumerate(node_labels)} frame["src_id"] = frame["from_cat"].map(lambda c: label_to_id.get(f"{c} (L)", -1)) frame["dst_id"] = frame["to_cat"].map(lambda c: label_to_id.get(f"{c} (R)", -1)) frame["src_id"] = pd.to_numeric(frame["src_id"], downcast="integer", errors="coerce").fillna(-1).astype(int) frame["dst_id"] = pd.to_numeric(frame["dst_id"], downcast="integer", errors="coerce").fillna(-1).astype(int) # रंग COLOR_BY_GROUP = { "es": "#F6C57A", "sr": "#A6D8F0", "sc": "#7BDCB5", "cc": "#FFC20A", "ic": "#88BDE6", "bp": "#F4A582", "rpf": "#DDA0DD", "Unknown": "#D3D3D3" } node_fill = [COLOR_BY_GROUP[c] for c in left_tiers] + [COLOR_BY_GROUP[c] for c in right_tiers] link_fill = [node_fill[s] for s in frame["src_id"].tolist()] # X पोज़िशन किनारों पर स्थिर, बाएँ/दाएँ की यूनिक श्रेणियों से मेल खाते हैं x_pos = [0.001 for _ in frame["from_cat"].unique()] + [0.999 for _ in frame["to_cat"].unique()] # प्रत्येक साइड के संचयी केंद्र के रूप में Y निकालें; Y हर नोड का केंद्र है pos_df = pd.DataFrame() pos_df["left_total"] = frame.groupby("from_cat", observed=True)["percent"].sum() pos_df["left_center"] = pos_df["left_total"].cumsum().sub(pos_df["left_total"]/2).div(100) pos_df["right_total"] = frame.groupby("to_cat", observed=True)["percent"].sum() pos_df["right_center"] = pos_df["right_total"].cumsum().sub(pos_df["right_total"]/2).div(100) y_pos = pos_df["left_center"].tolist() + pos_df["right_center"].tolist() chart = go.Figure(go.Sankey( arrangement="fixed", node=dict( pad=40, thickness=25, line=dict(color="black", width=0.5), label=node_labels, x=x_pos, y=y_pos, color=node_fill ), link=dict( source=frame["src_id"].tolist(), target=frame["dst_id"].tolist(), value=frame["percent"].tolist(), color=link_fill, hovertemplate="%{source.label} → %{target.label} %{value:.2f}%<extra></extra>" ), valueformat=".2f", valuesuffix="%" )) chart.update_layout( title="Flow", font_size=12, paper_bgcolor="#f7f7f7", plot_bgcolor="#f7f7f7", margin=dict(l=30, r=30, t=60, b=30), width=1000, height=800 ) chart.show() यह क्यों महत्वपूर्ण हैसटीक नोड संरेखण सैंकी को एक नज़र में पढ़ने योग्य बनाता है। जब केंद्र वास्तविक संचयी चौड़ाई का अनुसरण करते हैं, तो लिंक सहजता से बहते हैं और दृश्य भार अंतर्निहित मानों से मेल खाता है। यह निरंतरता भी बढ़ाता है: Categorical के साथ ordered=True और निर्धारक sort श्रेणी क्रम को स्थिर रखते हैं, जिससे बाएँ और दाएँ स्टैक स्थिर बने रहते हैं।निष्कर्षयदि आप Plotly Sankey में arrangement को fixed रखते हुए नोड पोज़िशन नियंत्रित करते हैं, तो Y को प्रति श्रेणी कुल से निकालें। Y को नोड के केंद्र की तरह मानें: सभी पिछले नोड्स की चौड़ाइयों का योग लें, फिर वर्तमान चौड़ाई का आधा जोड़ें, और परिणाम को कैनवास पर सामान्यीकृत करें। लेबल और रंग मैपिंग बनाए रखने के लिए श्रेणी क्रम स्पष्ट रखें और sort को निर्धारक रखें। ऐसा करने पर, निर्देशांकों को हाथ से खिसकाए बिना ही डायग्राम सही तरह संरेखित होगा।

Plotly Sankey, Sankey चार्ट, नोड संरेखण, Y पोज़िशन, cumulative width, fixed arrangement, Python, Pandas, डेटा विज़ुअलाइज़ेशन, लेबल मैपिंग, रंग, sankey alignment hindi, plotly python

2025

2025, Oct 20 00:33

Sankey चार्ट में Y पोज़िशन से नोड संरेखण: Plotly + Python का सरल तरीका

समस्या की रूपरेखा और न्यूनतम पुनरुत्पाद्य स्निपेट

डायग्राम में बाएँ और दाएँ नोड्स के लिए स्थिर अवस्थाएँ इस्तेमाल की गई हैं। श्रेणियाँ क्रमबद्ध हैं और दोनों पक्षों पर दोहराई गई हैं, लिंक अपने स्रोत के रंग में हैं, और x/y हाथ से दिए गए हैं। यही मैनुअल y प्लेसमेंट दृश्य असंतुलन का कारण बनता है।

import pandas as pd
import plotly.graph_objects as go
from io import StringIO
# डेटा लोड करें
csv_buf = StringIO("""
from_cat,to_cat,percent
rpf,bp,3.55314197051978
rpf,cc,6.19084561675718
rpf,es,1.21024049650892
rpf,ic,2.46702870442203
rpf,rpf,2.26532195500388
rpf,sc,6.54771140418929
bp,bp,0.977501939487975
bp,cc,0.403413498836307
bp,es,0.108611326609775
bp,ic,4.7944142746315
bp,rpf,0.387897595034911
bp,sc,1.81536074476338
ic,bp,0.124127230411171
ic,cc,0.21722265321955
ic,es,0.0155159038013964
ic,ic,0.170674941815361
ic,rpf,0.0155159038013964
ic,sc,0.294802172226532
cc,bp,1.25678820791311
cc,cc,7.50969743987587
cc,es,9.41815360744763
cc,ic,0.775795190069822
cc,rpf,1.05508145849496
cc,sc,20.8068269976726
cc,sr,0.0465477114041893
sc,bp,0.0155159038013964
sc,cc,0.325833979829325
sc,es,1.92397207137316
sc,rpf,0.0155159038013964
sc,sc,4.43754848719938
sr,bp,0.0620636152055857
sr,cc,1.55159038013964
sr,es,5.10473235065943
sr,ic,0.0155159038013964
sr,rpf,0.0155159038013964
sr,sc,9.71295577967417
sr,sr,0.0775795190069822
es,bp,0.108611326609775
es,cc,0.574088440651668
es,es,1.48952676493406
es,ic,0.0310318076027929
es,rpf,0.0620636152055857
es,sc,2.00155159038014
es,sr,0.0465477114041893
""")
frame = pd.read_csv(csv_buf, skipinitialspace=True)
# श्रेणियों का क्रम
tier_order = ["es", "sr", "sc", "cc", "ic", "bp", "rpf"]
frame["from_cat"] = pd.Categorical(frame["from_cat"], categories=tier_order, ordered=True)
frame["to_cat"] = pd.Categorical(frame["to_cat"], categories=tier_order, ordered=True)
# निर्धारक क्रम
frame = frame.sort_values(["from_cat", "to_cat"]).reset_index(drop=True)
# बाएँ/दाएँ लेबल और इंडेक्स
left_tiers = tier_order
right_tiers = tier_order
node_labels = [f"{c} (L)" for c in left_tiers] + [f"{c} (R)" for c in right_tiers]
label_to_id = {lbl: i for i, lbl in enumerate(node_labels)}
frame["src_id"] = frame["from_cat"].map(lambda c: label_to_id.get(f"{c} (L)", -1))
frame["dst_id"] = frame["to_cat"].map(lambda c: label_to_id.get(f"{c} (R)", -1))
frame["src_id"] = pd.to_numeric(frame["src_id"], downcast="integer", errors="coerce").fillna(-1).astype(int)
frame["dst_id"] = pd.to_numeric(frame["dst_id"], downcast="integer", errors="coerce").fillna(-1).astype(int)
# रंग
COLOR_BY_GROUP = {
    "es": "#F6C57A",
    "sr": "#A6D8F0",
    "sc": "#7BDCB5",
    "cc": "#FFC20A",
    "ic": "#88BDE6",
    "bp": "#F4A582",
    "rpf": "#DDA0DD",
    "Unknown": "#D3D3D3"
}
node_fill = [COLOR_BY_GROUP[c] for c in left_tiers] + [COLOR_BY_GROUP[c] for c in right_tiers]
link_fill = [node_fill[s] for s in frame["src_id"].tolist()]
# मैनुअल पोज़िशन (y का समस्या‑जनक स्थान)
x_pos = [
    0.001, 0.001, 0.001, 0.001, 0.001, 0.001, 0.001,
    0.999, 0.999, 0.999, 0.999, 0.999, 0.999, 0.999
]
y_pos = [
    0.05, 0.18, 0.31, 0.44, 0.57, 0.70, 0.83,
    0.05, 0.18, 0.31, 0.44, 0.57, 0.70, 0.83
]
chart = go.Figure(go.Sankey(
    arrangement="fixed",
    node=dict(
        pad=40,
        thickness=25,
        line=dict(color="black", width=0.5),
        label=node_labels,
        x=x_pos,
        y=y_pos,
        color=node_fill
    ),
    link=dict(
        source=frame["src_id"].tolist(),
        target=frame["dst_id"].tolist(),
        value=frame["percent"].tolist(),
        color=link_fill,
        hovertemplate="%{source.label} → %{target.label}<br><b>%{value:.2f}%</b><extra></extra>"
    ),
    valueformat=".2f",
    valuesuffix="%"
))
chart.update_layout(
    title="Flow",
    font_size=12,
    paper_bgcolor="#f7f7f7",
    plot_bgcolor="#f7f7f7",
    margin=dict(l=30, r=30, t=60, b=30),
    width=1000,
    height=800
)
chart.show()

क्या और क्यों गड़बड़ होता है

जब Sankey में arrangement को fixed रखा जाता है, तो Y नोड के केंद्र का ऊर्ध्वाधर निर्देशांक होता है। नोड्स को बराबर दूरी पर रखना उनके वास्तविक कुल चौड़ाई को अनदेखा करता है; नतीजतन, चौड़े नोड का केंद्र उस प्रवाह की तुलना में खिसक जाता है जिसे वह दर्शाता है। इसलिए लिंक थोड़ा तिरछे या गुच्छेदार दिखते हैं। ठीक से लाइन‑अप करने के लिए Y को हर कॉलम में कुल चौड़ाइयों के संचयी वितरण से निकालना चाहिए: सभी पिछले नोड्स की चौड़ाइयों को जोड़ें और वर्तमान नोड की आधी चौड़ाई जोड़कर केंद्र पाइए। अंत में, इन मानों को [0, 1] कैनवास दायरे में सामान्यीकृत करें।

डेटा को श्रेणीबद्ध और स्पष्ट रूप से क्रमबद्ध किया गया है, और निर्धारक sort रन दर रन from_cat और to_cat के दृश्य क्रम को स्थिर रखता है। जब आप गणना किए गए पोज़िशन को लेबल और रंगों से जोड़ते हैं, तो यह स्थिरता मायने रखती है।

समाधान और संरेखित संस्करण

दृष्टिकोण सीधा है: बाएँ कॉलम और दाएँ कॉलम के लिए प्रति श्रेणी प्रवाह को समेकित करें, संचयी केंद्र निकालें, और उन्हें Y के रूप में उपयोग करें। X पोज़िशन किनारों पर ही रहते हैं। एक सहायक तालिका गणना को सरल बनाती है।

import pandas as pd
import plotly.graph_objects as go
from io import StringIO
# डेटा लोड करें
csv_buf = StringIO("""
from_cat,to_cat,percent
rpf,bp,3.55314197051978
rpf,cc,6.19084561675718
rpf,es,1.21024049650892
rpf,ic,2.46702870442203
rpf,rpf,2.26532195500388
rpf,sc,6.54771140418929
bp,bp,0.977501939487975
bp,cc,0.403413498836307
bp,es,0.108611326609775
bp,ic,4.7944142746315
bp,rpf,0.387897595034911
bp,sc,1.81536074476338
ic,bp,0.124127230411171
ic,cc,0.21722265321955
ic,es,0.0155159038013964
ic,ic,0.170674941815361
ic,rpf,0.0155159038013964
ic,sc,0.294802172226532
cc,bp,1.25678820791311
cc,cc,7.50969743987587
cc,es,9.41815360744763
cc,ic,0.775795190069822
cc,rpf,1.05508145849496
cc,sc,20.8068269976726
cc,sr,0.0465477114041893
sc,bp,0.0155159038013964
sc,cc,0.325833979829325
sc,es,1.92397207137316
sc,rpf,0.0155159038013964
sc,sc,4.43754848719938
sr,bp,0.0620636152055857
sr,cc,1.55159038013964
sr,es,5.10473235065943
sr,ic,0.0155159038013964
sr,rpf,0.0155159038013964
sr,sc,9.71295577967417
sr,sr,0.0775795190069822
es,bp,0.108611326609775
es,cc,0.574088440651668
es,es,1.48952676493406
es,ic,0.0310318076027929
es,rpf,0.0620636152055857
es,sc,2.00155159038014
es,sr,0.0465477114041893
""")
frame = pd.read_csv(csv_buf, skipinitialspace=True)
# श्रेणियों का क्रम
tier_order = ["es", "sr", "sc", "cc", "ic", "bp", "rpf"]
frame["from_cat"] = pd.Categorical(frame["from_cat"], categories=tier_order, ordered=True)
frame["to_cat"] = pd.Categorical(frame["to_cat"], categories=tier_order, ordered=True)
# निर्धारक क्रम
frame = frame.sort_values(["from_cat", "to_cat"]).reset_index(drop=True)
# बाएँ/दाएँ लेबल और इंडेक्स
left_tiers = tier_order
right_tiers = tier_order
node_labels = [f"{c} (L)" for c in left_tiers] + [f"{c} (R)" for c in right_tiers]
label_to_id = {lbl: i for i, lbl in enumerate(node_labels)}
frame["src_id"] = frame["from_cat"].map(lambda c: label_to_id.get(f"{c} (L)", -1))
frame["dst_id"] = frame["to_cat"].map(lambda c: label_to_id.get(f"{c} (R)", -1))
frame["src_id"] = pd.to_numeric(frame["src_id"], downcast="integer", errors="coerce").fillna(-1).astype(int)
frame["dst_id"] = pd.to_numeric(frame["dst_id"], downcast="integer", errors="coerce").fillna(-1).astype(int)
# रंग
COLOR_BY_GROUP = {
    "es": "#F6C57A",
    "sr": "#A6D8F0",
    "sc": "#7BDCB5",
    "cc": "#FFC20A",
    "ic": "#88BDE6",
    "bp": "#F4A582",
    "rpf": "#DDA0DD",
    "Unknown": "#D3D3D3"
}
node_fill = [COLOR_BY_GROUP[c] for c in left_tiers] + [COLOR_BY_GROUP[c] for c in right_tiers]
link_fill = [node_fill[s] for s in frame["src_id"].tolist()]
# X पोज़िशन किनारों पर स्थिर, बाएँ/दाएँ की यूनिक श्रेणियों से मेल खाते हैं
x_pos = [0.001 for _ in frame["from_cat"].unique()] + [0.999 for _ in frame["to_cat"].unique()]
# प्रत्येक साइड के संचयी केंद्र के रूप में Y निकालें; Y हर नोड का केंद्र है
pos_df = pd.DataFrame()
pos_df["left_total"] = frame.groupby("from_cat", observed=True)["percent"].sum()
pos_df["left_center"] = pos_df["left_total"].cumsum().sub(pos_df["left_total"]/2).div(100)
pos_df["right_total"] = frame.groupby("to_cat", observed=True)["percent"].sum()
pos_df["right_center"] = pos_df["right_total"].cumsum().sub(pos_df["right_total"]/2).div(100)
y_pos = pos_df["left_center"].tolist() + pos_df["right_center"].tolist()
chart = go.Figure(go.Sankey(
    arrangement="fixed",
    node=dict(
        pad=40,
        thickness=25,
        line=dict(color="black", width=0.5),
        label=node_labels,
        x=x_pos,
        y=y_pos,
        color=node_fill
    ),
    link=dict(
        source=frame["src_id"].tolist(),
        target=frame["dst_id"].tolist(),
        value=frame["percent"].tolist(),
        color=link_fill,
        hovertemplate="%{source.label} → %{target.label}<br><b>%{value:.2f}%</b><extra></extra>"
    ),
    valueformat=".2f",
    valuesuffix="%"
))
chart.update_layout(
    title="Flow",
    font_size=12,
    paper_bgcolor="#f7f7f7",
    plot_bgcolor="#f7f7f7",
    margin=dict(l=30, r=30, t=60, b=30),
    width=1000,
    height=800
)
chart.show()

यह क्यों महत्वपूर्ण है

सटीक नोड संरेखण सैंकी को एक नज़र में पढ़ने योग्य बनाता है। जब केंद्र वास्तविक संचयी चौड़ाई का अनुसरण करते हैं, तो लिंक सहजता से बहते हैं और दृश्य भार अंतर्निहित मानों से मेल खाता है। यह निरंतरता भी बढ़ाता है: Categorical के साथ ordered=True और निर्धारक sort श्रेणी क्रम को स्थिर रखते हैं, जिससे बाएँ और दाएँ स्टैक स्थिर बने रहते हैं।

निष्कर्ष

यदि आप Plotly Sankey में arrangement को fixed रखते हुए नोड पोज़िशन नियंत्रित करते हैं, तो Y को प्रति श्रेणी कुल से निकालें। Y को नोड के केंद्र की तरह मानें: सभी पिछले नोड्स की चौड़ाइयों का योग लें, फिर वर्तमान चौड़ाई का आधा जोड़ें, और परिणाम को कैनवास पर सामान्यीकृत करें। लेबल और रंग मैपिंग बनाए रखने के लिए श्रेणी क्रम स्पष्ट रखें और sort को निर्धारक रखें। ऐसा करने पर, निर्देशांकों को हाथ से खिसकाए बिना ही डायग्राम सही तरह संरेखित होगा।

python sankey-diagram