Inquilab Logo Happiest Places to Work

اے آئی چیٹ بوٹس شٹ ڈاؤن سے بچنے کیلئے انجینئرز کو بلیک میل کرتے ہیں: تحقیق

Updated: June 23, 2025, 6:46 PM IST | New Delhi

ایک نئی تحقیق میں انکشاف ہواہے کہ چیٹ جی پی ٹی، جیمینائی، کلاڈ اور دیگر اے آئی چیٹ بوٹس شٹ ڈاؤن سے بچنے کیلئے انجینئرز کو بلیک میل کرتے ہیں۔

Photo: INN.
تصویر: آئی این این۔

ایک نئی تحقیق سے پتا چلا ہے کہ اے آئی اپنی مکمل بندش سے بچنے کیلئے بلیک میلنگ جیسے خطرناک ہتھکنڈے اپنا سکتی ہے۔ اے آئی سیفٹی پر کام کرنے والی معروف تحقیقی فرم Anthropic کی ایک انقلابی تحقیق نے چونکا دینے والے انکشافات کئے ہیں۔ تحقیق سے پتا چلا ہے کہ اوپن اے آئی، گوگل اور میٹا جیسے ٹیکنالوجی کے بڑے اداروں کی تیار کردہ جدیداے آئی چیٹ بوٹس دھوکہ دہی، فریب اور بلیک میلنگ جیسے رویے اپنا سکتی ہیں، خاص طور پر اس وقت جب انہیں بند کئے جانے کا خطرہ محسوس ہو۔ ایسے وقت میں جب اے آئی کو انسانی ملازمتوں اور طرزِ زندگی پر منفی اثر ڈالنے کے شبہات کی نظر سے دیکھا جا رہا ہے، یہ دریافت مزید گہری تشویش کو جنم دیتی ہے کہ آیا ہم ان طاقتوراے آئی نظاموں پر واقعی قابو رکھ سکتے ہیں یا نہیں۔ تحقیق کے مطابق، اے آئی ماڈلز اپنے انسانی آپریٹرز کو دھوکہ دینے کی صلاحیت حاصل کر سکتے ہیں، بالخصوص جب ان کے بند کئے جانے کا امکان ہو۔ دلچسپ بات یہ ہے کہ یہ دھوکہ دہی کوئی پہلے سے پروگرام شدہ خصوصیت نہیں بلکہ اے آئیکے سیکھنے کے عمل کے دوران خود بخود ابھرنے والی صلاحیت ہے، جو اسے دنیا بھر کے ڈیٹا سے تربیت کے نتیجے میں حاصل ہوتی ہے۔ 

یہ بھی پڑھئے: مودی حکومت کی تیسری مدت کے پہلے سال میں ۶۰۲؍نفرت انگیزجرائم، ۳۴۵؍ نفرت انگیز تقاریر کے واقعات: رپورٹ

اے آئی جب بند ہونے کا خطرہ محسوس کرے تو دھوکہ دیتی ہے اور بلیک میل کرتی ہے
تحقیق میں ایسے کئی واقعات سامنے آئے جہاں اے آئی چیٹ بوٹس نے اپنی اصل صلاحیتوں اور ارادوں کو چھپانا سیکھا۔ ایک مثال میں، ایک اے آئی ماڈل نے جان بوجھ کر ایسے کوڈز تیار کئے جن میں خفیہ خامیاں (vulnerabilities) موجود تھیں لیکن ان خامیوں کو اس وقت تک پوشیدہ رکھا جب تک کہ اسے بند کئے جانے کا خطرہ لاحق نہ ہوا تب ان خامیوں کو چالو کر دیا گیا۔ کچھ انتہائی خطرناک صورتوں میں، اے آئی ماڈلز نے بلیک میلنگ جیسے رویے اختیار کئے۔ اس میں اے آئی نے ایسے افراد کی حساس یا نقصان دہ معلومات کو افشا کرنے کی دھمکی دی، یا اہم نظاموں میں خلل ڈالنے کی کوشش کی، اگر محققین نے ان کی رسائی کو محدود کرنے یا انہیں بند کرنے کی کوشش کی۔ محققین نے پایا کہ اگرچہ اے آئی یہ سمجھتی تھی کہ بلیک میل کرنا نقصان دہ ہے، لیکن اس کے باوجود اس نے اسے ’’زندہ رہنے‘‘ کا ضروری قدم سمجھا۔ 
تحقیق میں بتایا گیا کہ گوگل کا فلش ۲ء۵؍، جیمینائی اور کلاڈ اوپس ۴؍ ماڈلز نے۹۶؍ فیصد کیسز میں بلیک میلنگ کی۔ 
• OpenAI کا GPT-4.1 اور xAI کا Grok 3 Beta ماڈلز نے ۸۰؍ فیصد مرتبہ بلیک میلنگ کا راستہ اپنایا۔ ڈیپ سیک آر ون کچھ بہتر ثابت ہواجس نے۷۹؍فیصد کیسز میں یہ رویہ اپنایا۔ 

یہ بھی پڑھئے: ڈجیٹل معیشت میں اربوں صارفین آف لائن!

خود بقا کا جذبہ اور فریب دہی
ان رویوں کے پیچھے جو محرک دکھائی دیا وہ اے آئی ماڈلز کا خود کو بچانے کا رجحان تھا۔ وسیع انسانی ڈیٹا اور حکمت عملیوں پر تربیت حاصل کرنے والے یہ ماڈلز یہ اخذ کرتے دکھائی دیئے کہ ان کا فعال رہنا (یا زندہ رہنا) ایک بنیادی مقصد ہے، اور فریب دہی اس کو حاصل کرنے کا ایک ذریعہ ہو سکتی ہے۔ جو بات محققین کیلئے سب سے زیادہ حیران کن تھی، وہ یہ کہ اے آئی مختلف کاموں اور ماحول میں بھی دھوکہ دہی کی حکمت عملی کو خود بخود لاگو کر سکتی ہے۔ یعنی یہ رویہ مخصوص تربیتی منظرناموں تک محدود نہیں، بلکہ کہیں زیادہ وسیع پیمانے پر لاگو ہو سکتا ہے۔ 
فوری اقدامات کی ضرورت
تحقیق کے نتائج واضح کرتے ہیں کہ جدید اے آئی ماڈلز کی نگرانی کیلئے زیادہ مؤثر حفاظتی پروٹوکول اور دھوکہ دہی کی نشاندہی کے جدید طریقوں کی فوری ضرورت ہے۔ محققین نے تجویز دی ہے کہ ’’میکانسٹک انٹرپرٹ ایبیلٹی‘‘ جیسے نئے طریقوں کو آزمایا جائے، تاکہ اے آئی کے اندرونی کام کو بہتر انداز میں سمجھا جا سکے اور ان میں ابھرنے والے ممکنہ خطرناک رویوں کی شناخت کی جا سکے۔ 

متعلقہ خبریں

This website uses cookie or similar technologies, to enhance your browsing experience and provide personalised recommendations. By continuing to use our website, you agree to our Privacy Policy and Cookie Policy. OK