Benford’s Law: Data Analytics में इसकी भूमिका

Benford’s Law: Data Analytics में इसकी भूमिका

कैसे Benford’s Law fraud का पता लगाने में मदद करता है?

Benford’s Law क्या है?

Benford’s Law एक बहुत ही interesting और surprising mathematical principle है, जिसे सबसे पहले 1881 में Simon Newcomb ने discover किया था और बाद में 1938 में Frank Benford ने इसे famous बनाया। यह law कहता है कि किसी भी naturally occurring data set में numbers के पहले digits का distribution uniform नहीं होता। आमतौर पर लोग सोचते हैं कि एक data set में सभी पहले digits (1 से 9 तक) लगभग equal बार आएंगे, लेकिन Benford’s Law इसके ठीक उलट बताता है। इस law के अनुसार, छोटे digits जैसे 1, 2, और 3 बड़े digits (जैसे 8 और 9) की तुलना में कहीं ज्यादा बार पहले digit के रूप में appear करते हैं।

उदाहरण के लिए, इस law के हिसाब से किसी भी बड़े और natural data set में लगभग **30.1% numbers “1” से शुरू होते हैं**, जबकि “2” से शुरू होने वाले numbers 17.6% और “3” से शुरू होने वाले 12.5% होते हैं। इसके opposite में, “9” से शुरू होने वाले numbers सिर्फ **4.6%** होते हैं। यह pattern पहली नजर में strange लग सकता है, लेकिन यह कई real-world data sets में बार-बार देखा गया है, जैसे population statistics, rivers की length, stock prices, और यहाँ तक कि electricity bills की amount।

Benford’s Law का Mathematical Formula

Benford’s Law को mathematically एक simple लेकिन powerful formula से explain किया जाता है:

P(d) = log10(1 + 1/d)

यहाँ “P(d)” उस probability को represent करता है कि कोई number “d” digit से शुरू होगा, जहाँ “d” 1 से 9 तक कोई भी digit हो सकता है। For example, अगर हम “d = 1” डालें, तो formula होगा: log10(1 + 1/1) = log10(2) ≈ 0.301, जो 30.1% है। Similarly, “d = 9” के लिए: log10(1 + 1/9) = log10(10/9) ≈ 0.0458, जो 4.58% है। यह formula इस law के पीछे की mathematical foundation को clear करता है और बताता है कि small digits बड़े digits की तुलना में क्यों ज्यादा बार पहले position पर आते हैं।

इस law का base यह है कि natural data अक्सर logarithmic scale पर distributed होता है। इसका मतलब है कि numbers जो 1 से शुरू होते हैं, उनके पास 2 से शुरू होने वाले numbers की तुलना में ज्यादा “chances” होते हैं, और यह pattern आगे बढ़ता रहता है। यह एक counterintuitive concept हो सकता है, लेकिन यह real-world data में बार-बार proven हुआ है।

Benford’s Law का Use कहाँ होता है?

Benford’s Law का use आज के digital age में कई fields में होता है, खासकर जहाँ data की authenticity और truthfulness check करना जरूरी हो। यह law उन areas में बहुत useful है जहाँ human interference या fraud की possibility होती है। Let’s see इसके कुछ major uses:

  • Fraud Detection में: Benford’s Law का सबसे popular use financial fraud को detect करने में है। For example, अगर किसी company के financial records या tax returns में पहले digits का distribution Benford’s Law से match नहीं करता, तो यह indicate कर सकता है कि data में manipulation हुआ है।
  • Auditing में: Companies के accounting records को audit करते समय, अगर numbers इस law को follow नहीं करते, तो यह potential financial irregularity का sign हो सकता है। Auditors इसे use करते हैं suspicious patterns को spot करने के लिए।
  • Cryptocurrency और Banking Sector में: Unusual transactions को catch करने के लिए, जैसे fake trades या money laundering, यह law बहुत helpful है। Banks और crypto platforms इसे irregular activities को monitor करने के लिए apply करते हैं।
  • Cyber Security में: Digital forensics और data breach investigations में, यह law abnormal data patterns को identify करने में मदद करता है, जो hacking या unauthorized access का hint दे सकते हैं।

इनके अलावा, Benford’s Law का use scientific research, election result analysis, और यहाँ तक कि social media data की authenticity check करने में भी होता है। इसका wide application इसे data analytics का एक powerful tool बनाता है।

Benford’s Law का Real-Life Example

मान लीजिए एक company का financial data कुछ इस तरह है। Company ने अपने monthly expenses का record दिया है, और हम इसे Benford’s Law से analyze करते हैं:

Number First Digit
1450 1
2789 2
9200 9

अगर हम इस data को analyze करें और देखें कि “9” से शुरू होने वाले numbers expected से बहुत ज्यादा हैं (जबकि Benford’s Law के अनुसार इनका percentage सिर्फ 4.6% होना चाहिए), तो यह red flag हो सकता है। हो सकता है कि कोई employee fake invoices बनाकर funds embezzle कर रहा हो। ऐसे cases में auditors deep investigation करते हैं।

Real-world में, Enron scandal (2001) जैसे बड़े fraud cases में Benford’s Law ने irregularities को highlight करने में मदद की थी। इसी तरह, election fraud की investigations में भी इसका use हुआ है, जहाँ voting numbers का distribution suspicious पाया गया।


Vista Academy – 316/336, Park Rd, Laxman Chowk, Dehradun – 248001
📞 +91 94117 78145 | 📧 thevistaacademy@gmail.com | 💬 WhatsApp
💬 Chat on WhatsApp: Ask About Our Courses