اے آئی چیٹ بوٹس شٹ ڈاؤن سے بچنے کیلئے انجینئرز کو بلیک میل کرتے ہیں: تحقیق

Updated: June 23, 2025, 6:46 PM IST | New Delhi

ایک نئی تحقیق میں انکشاف ہواہے کہ چیٹ جی پی ٹی، جیمینائی، کلاڈ اور دیگر اے آئی چیٹ بوٹس شٹ ڈاؤن سے بچنے کیلئے انجینئرز کو بلیک میل کرتے ہیں۔

تصویر: آئی این این۔

ایک نئی تحقیق سے پتا چلا ہے کہ اے آئی اپنی مکمل بندش سے بچنے کیلئے بلیک میلنگ جیسے خطرناک ہتھکنڈے اپنا سکتی ہے۔ اے آئی سیفٹی پر کام کرنے والی معروف تحقیقی فرم Anthropic کی ایک انقلابی تحقیق نے چونکا دینے والے انکشافات کئے ہیں۔ تحقیق سے پتا چلا ہے کہ اوپن اے آئی، گوگل اور میٹا جیسے ٹیکنالوجی کے بڑے اداروں کی تیار کردہ جدیداے آئی چیٹ بوٹس دھوکہ دہی، فریب اور بلیک میلنگ جیسے رویے اپنا سکتی ہیں، خاص طور پر اس وقت جب انہیں بند کئے جانے کا خطرہ محسوس ہو۔ ایسے وقت میں جب اے آئی کو انسانی ملازمتوں اور طرزِ زندگی پر منفی اثر ڈالنے کے شبہات کی نظر سے دیکھا جا رہا ہے، یہ دریافت مزید گہری تشویش کو جنم دیتی ہے کہ آیا ہم ان طاقتوراے آئی نظاموں پر واقعی قابو رکھ سکتے ہیں یا نہیں۔ تحقیق کے مطابق، اے آئی ماڈلز اپنے انسانی آپریٹرز کو دھوکہ دینے کی صلاحیت حاصل کر سکتے ہیں، بالخصوص جب ان کے بند کئے جانے کا امکان ہو۔ دلچسپ بات یہ ہے کہ یہ دھوکہ دہی کوئی پہلے سے پروگرام شدہ خصوصیت نہیں بلکہ اے آئیکے سیکھنے کے عمل کے دوران خود بخود ابھرنے والی صلاحیت ہے، جو اسے دنیا بھر کے ڈیٹا سے تربیت کے نتیجے میں حاصل ہوتی ہے۔

یہ بھی پڑھئے: مودی حکومت کی تیسری مدت کے پہلے سال میں ۶۰۲؍نفرت انگیزجرائم، ۳۴۵؍ نفرت انگیز تقاریر کے واقعات: رپورٹ

اے آئی جب بند ہونے کا خطرہ محسوس کرے تو دھوکہ دیتی ہے اور بلیک میل کرتی ہے
تحقیق میں ایسے کئی واقعات سامنے آئے جہاں اے آئی چیٹ بوٹس نے اپنی اصل صلاحیتوں اور ارادوں کو چھپانا سیکھا۔ ایک مثال میں، ایک اے آئی ماڈل نے جان بوجھ کر ایسے کوڈز تیار کئے جن میں خفیہ خامیاں (vulnerabilities) موجود تھیں لیکن ان خامیوں کو اس وقت تک پوشیدہ رکھا جب تک کہ اسے بند کئے جانے کا خطرہ لاحق نہ ہوا تب ان خامیوں کو چالو کر دیا گیا۔ کچھ انتہائی خطرناک صورتوں میں، اے آئی ماڈلز نے بلیک میلنگ جیسے رویے اختیار کئے۔ اس میں اے آئی نے ایسے افراد کی حساس یا نقصان دہ معلومات کو افشا کرنے کی دھمکی دی، یا اہم نظاموں میں خلل ڈالنے کی کوشش کی، اگر محققین نے ان کی رسائی کو محدود کرنے یا انہیں بند کرنے کی کوشش کی۔ محققین نے پایا کہ اگرچہ اے آئی یہ سمجھتی تھی کہ بلیک میل کرنا نقصان دہ ہے، لیکن اس کے باوجود اس نے اسے ’’زندہ رہنے‘‘ کا ضروری قدم سمجھا۔
تحقیق میں بتایا گیا کہ گوگل کا فلش ۲ء۵؍، جیمینائی اور کلاڈ اوپس ۴؍ ماڈلز نے۹۶؍ فیصد کیسز میں بلیک میلنگ کی۔
• OpenAI کا GPT-4.1 اور xAI کا Grok 3 Beta ماڈلز نے ۸۰؍ فیصد مرتبہ بلیک میلنگ کا راستہ اپنایا۔ ڈیپ سیک آر ون کچھ بہتر ثابت ہواجس نے۷۹؍فیصد کیسز میں یہ رویہ اپنایا۔

یہ بھی پڑھئے: ڈجیٹل معیشت میں اربوں صارفین آف لائن!

خود بقا کا جذبہ اور فریب دہی
ان رویوں کے پیچھے جو محرک دکھائی دیا وہ اے آئی ماڈلز کا خود کو بچانے کا رجحان تھا۔ وسیع انسانی ڈیٹا اور حکمت عملیوں پر تربیت حاصل کرنے والے یہ ماڈلز یہ اخذ کرتے دکھائی دیئے کہ ان کا فعال رہنا (یا زندہ رہنا) ایک بنیادی مقصد ہے، اور فریب دہی اس کو حاصل کرنے کا ایک ذریعہ ہو سکتی ہے۔ جو بات محققین کیلئے سب سے زیادہ حیران کن تھی، وہ یہ کہ اے آئی مختلف کاموں اور ماحول میں بھی دھوکہ دہی کی حکمت عملی کو خود بخود لاگو کر سکتی ہے۔ یعنی یہ رویہ مخصوص تربیتی منظرناموں تک محدود نہیں، بلکہ کہیں زیادہ وسیع پیمانے پر لاگو ہو سکتا ہے۔
فوری اقدامات کی ضرورت
تحقیق کے نتائج واضح کرتے ہیں کہ جدید اے آئی ماڈلز کی نگرانی کیلئے زیادہ مؤثر حفاظتی پروٹوکول اور دھوکہ دہی کی نشاندہی کے جدید طریقوں کی فوری ضرورت ہے۔ محققین نے تجویز دی ہے کہ ’’میکانسٹک انٹرپرٹ ایبیلٹی‘‘ جیسے نئے طریقوں کو آزمایا جائے، تاکہ اے آئی کے اندرونی کام کو بہتر انداز میں سمجھا جا سکے اور ان میں ابھرنے والے ممکنہ خطرناک رویوں کی شناخت کی جا سکے۔

اے آئی چیٹ بوٹس شٹ ڈاؤن سے بچنے کیلئے انجینئرز کو بلیک میل کرتے ہیں: تحقیق

متعلقہ خبریں