blank

اوپن سورس ChatGPT متبادل تیار کرنے والی ٹیم سے ملیں۔

خطرے میں واضح طور پر بتاتے ہوئے، AI سے چلنے والے چیٹ بوٹس ابھی گرم ہیں۔

ٹولز، جو مضامین، ای میلز اور مزید کچھ متن پر مبنی ہدایات لکھ سکتے ہیں، نے ٹیک شوقین اور کاروباری اداروں کی توجہ یکساں طور پر حاصل کر لی ہے۔ اوپن اے آئی چیٹ جی پی ٹیarguably progenitor کے پاس ایک ہے۔ اندازہ لگایا گیا 100 ملین سے زیادہ صارفین۔ ایک کے ذریعے API، برانڈز بشمول Instacart، Quizlet اور Snap نے اسے اپنے متعلقہ پلیٹ فارمز میں بنانا شروع کر دیا ہے، جس سے استعمال کی تعداد میں مزید اضافہ ہوا ہے۔

لیکن ڈویلپر کمیونٹی کے اندر کچھ لوگوں کی ناراضگی کی وجہ سے، یہ چیٹ بوٹس بنانے والی تنظیمیں ایک اچھی مالی اعانت یافتہ، اچھی طرح سے وسائل اور خصوصی کلب کا حصہ بنی ہوئی ہیں۔ اینتھروپک، ڈیپ مائنڈ اور اوپن اے آئی – جن میں سے سبھی کی جیبیں گہری ہیں – ان چند لوگوں میں شامل ہیں جنہوں نے اپنی جدید چیٹ بوٹ ٹیکنالوجیز کو تیار کرنے میں کامیاب کیا ہے۔ اس کے برعکس اوپن سورس کمیونٹی رہی ہے۔ روکا ہوا ایک بنانے کی کوششوں میں۔

اس کی بڑی وجہ یہ ہے کہ چیٹ بوٹس کو زیر کرنے والے AI ماڈلز کی تربیت کے لیے بہت زیادہ پروسیسنگ پاور کی ضرورت ہوتی ہے، ایک بڑے ٹریننگ ڈیٹاسیٹ کا ذکر نہ کرنا جس کو بڑی محنت سے تیار کرنا ہوتا ہے۔ لیکن محققین کا ایک نیا، ڈھیلے سے منسلک گروپ جو خود کو بلا رہا ہے۔ ایک ساتھ ان چیلنجوں پر قابو پانے کا مقصد ChatGPT جیسے سسٹم کو اوپن سورس کرنے والے پہلے شخص بننا ہے۔

ایک ساتھ مل کر پہلے ہی ترقی کر چکے ہیں۔ پچھلے ہفتے، یہ تربیت یافتہ ماڈلز جاری کر رہا ہے جو کوئی بھی ڈویلپر AI سے چلنے والی چیٹ بوٹ بنانے کے لیے استعمال کر سکتا ہے۔

ٹوگیدر کے شریک بانی وپول وید پرکاش نے ایک ای میل انٹرویو میں TechCrunch کو بتایا کہ “ٹوگیدر اوپن فاؤنڈیشن ماڈلز کے لیے ایک قابل رسائی پلیٹ فارم بنا رہا ہے۔” “ہم سوچتے ہیں کہ ہم AI کے ‘Linux لمحے’ کے حصے کے طور پر کیا بنا رہے ہیں۔ ہم محققین، ڈویلپرز اور کمپنیوں کو ایک پلیٹ فارم کے ساتھ اوپن سورس AI ماڈلز کو استعمال کرنے اور بہتر بنانے کے قابل بنانا چاہتے ہیں جو ڈیٹا، ماڈلز اور کمپیوٹیشن کو اکٹھا کرتا ہے۔”

پرکاش پہلے شریک بانی تھے۔ کلاؤڈ مارک، ایک سائبرسیکیوریٹی اسٹارٹ اپ جسے پروف پوائنٹ نے 2017 میں $110 ملین میں خریدا تھا۔ ایپل کے پرکاش کے اگلے منصوبے کو حاصل کرنے کے بعد، سوشل میڈیا سرچ اور اینالیٹکس پلیٹ فارم ٹاپسی2013 میں، وہ ٹوگیدر شروع کرنے کے لیے روانہ ہونے سے پہلے پانچ سال تک ایپل میں بطور سینئر ڈائریکٹر رہے۔

ہفتے کے آخر میں، ٹوگیدر نے اپنا پہلا بڑا پروجیکٹ شروع کیا، اوپن چیٹ کٹ, خصوصی اور عام مقصد والے AI سے چلنے والے چیٹ بوٹس بنانے کے لیے ایک فریم ورک۔ GitHub پر دستیاب اس کٹ میں مذکورہ بالا تربیت یافتہ ماڈلز اور ایک “قابل توسیع” بازیافت کا نظام شامل ہے جو ماڈلز کو مختلف ذرائع اور ویب سائٹس سے معلومات (مثلاً تازہ ترین کھیلوں کے اسکور) حاصل کرنے کی اجازت دیتا ہے۔

بیس ماڈلز EleutherAI، a سے آئے تھے۔ غیر منافع بخش متن پیدا کرنے والے نظاموں کی تحقیقات کرنے والے محققین کا گروپ۔ لیکن ان کو ٹوگیدر کے کمپیوٹ انفراسٹرکچر، ٹوگیدر ڈی سینٹرلائزڈ کلاؤڈ کا استعمال کرتے ہوئے ٹھیک بنایا گیا تھا، جو انٹرنیٹ کے ارد گرد رضاکاروں کے GPUs سمیت ہارڈ ویئر کے وسائل کو جمع کرتا ہے۔

پرکاش نے کہا کہ “ایک ساتھ مل کر ماخذ کے ذخیرے تیار کیے جو کسی کو بھی ماڈل کے نتائج کو نقل کرنے، اپنے ماڈل کو ٹھیک کرنے یا بازیافت کے نظام کو مربوط کرنے کی اجازت دیتا ہے۔” “ایک ساتھ مل کر دستاویزات اور کمیونٹی کے عمل کو بھی تیار کیا۔”

تربیت کے بنیادی ڈھانچے سے ہٹ کر، LAION سمیت دیگر تحقیقی تنظیموں کے ساتھ مل کر تعاون کیا (جس نے ترقی میں مدد کی۔ مستحکم بازی) اور تکنیکی ماہر Huu Nguyen’s آنٹوکارڈ ماڈلز کے لیے تربیتی ڈیٹاسیٹ بنانے کے لیے۔ کو بلایا انسٹرکشن جنرلسٹ ڈیٹاسیٹ کھولیں۔، ڈیٹا سیٹ میں سوالات اور جوابات کی 40 ملین سے زیادہ مثالیں، فالو اپ سوالات اور مزید ایک ماڈل کو “سکھانے” کے لیے ڈیزائن کیا گیا ہے کہ مختلف ہدایات کا جواب کیسے دیا جائے (مثلاً “خانہ جنگی پر تاریخ کے کاغذ کے لیے خاکہ لکھیں”)۔

رائے طلب کرنے کے لیے، ٹوگیدر نے ایک جاری کیا۔ ڈیمو جسے کوئی بھی OpenChatKit ماڈلز کے ساتھ تعامل کرنے کے لیے استعمال کر سکتا ہے۔

پرکاش نے مزید کہا، “اہم محرک یہ تھا کہ کسی کو بھی اوپن چیٹ کٹ استعمال کرنے کے لیے ماڈل کو بہتر بنانے کے ساتھ ساتھ مزید ٹاسک مخصوص چیٹ ماڈلز بنانے کے قابل بنایا جائے۔” “جبکہ بڑے زبان کے ماڈلز نے عام سوالات کے جوابات دینے کی متاثر کن صلاحیت کا مظاہرہ کیا ہے، لیکن جب وہ مخصوص ایپلی کیشنز کے لیے ٹھیک ٹیوننگ کرتے ہیں تو وہ بہت زیادہ درستگی حاصل کرتے ہیں۔”

پرکاش کا کہنا ہے کہ ماڈلز بہت سے کام انجام دے سکتے ہیں، جن میں ہائی اسکول کی سطح کے بنیادی ریاضی کے مسائل کو حل کرنا، Python کوڈ بنانا، کہانیاں لکھنا اور دستاویزات کا خلاصہ کرنا شامل ہیں۔ تو وہ جانچ کے لیے کتنی اچھی طرح سے کھڑے ہیں؟ ٹھیک ہے، میرے تجربے میں – کم از کم بنیادی چیزوں کے لیے جیسے قابل فہم آواز والے کور لیٹر لکھنا۔

اوپن چیٹ کٹ

OpenChatKit دیگر چیزوں کے علاوہ کور لیٹر بھی لکھ سکتا ہے۔ تصویری کریڈٹ: اوپن چیٹ کٹ

لیکن ایک بہت واضح حد ہے۔ OpenChatKit ماڈلز کے ساتھ کافی دیر تک چیٹنگ کرتے رہیں اور وہ انہی مسائل سے دوچار ہونے لگتے ہیں جو ChatGPT اور دیگر حالیہ چیٹ بوٹس دکھاتے ہیں، جیسے غلط معلومات کو طوطی کرنا۔ مجھے OpenChatKit کے ماڈلز اس بارے میں متضاد جواب دینے کے لیے ملے ہیں کہ آیا زمین چپٹی ہے، مثال کے طور پر، اور 2020 کے امریکی صدارتی انتخابات میں کس نے کامیابی حاصل کی اس کے بارے میں ایک صریح غلط بیان۔

اوپن چیٹ کٹ

OpenChatKit، 2020 کے امریکی صدارتی انتخابات کے بارے میں ایک سوال (غلط طریقے سے) کا جواب دے رہا ہے۔ تصویری کریڈٹ: اوپن چیٹ کٹ

OpenChatKit ماڈل دوسرے، کم خطرناک علاقوں میں کمزور ہیں، جیسے سیاق و سباق کی تبدیلی۔ بات چیت کے بیچ میں موضوع کو تبدیل کرنے سے وہ اکثر الجھ جاتے ہیں۔ وہ تخلیقی تحریر اور کوڈنگ کے کاموں میں بھی خاص طور پر ہنر مند نہیں ہیں، اور بعض اوقات اپنے جوابات کو لامتناہی دہراتے ہیں۔

پرکاش نے تربیتی ڈیٹا سیٹ کو مورد الزام ٹھہرایا، جسے وہ نوٹ کرتے ہیں کہ ایک فعال کام جاری ہے۔ “یہ ایک ایسا علاقہ ہے جس میں ہم بہتری لاتے رہیں گے اور ہم نے ایک ایسا عمل ڈیزائن کیا ہے جہاں کھلی برادری اس میں فعال طور پر حصہ لے سکتی ہے،” انہوں نے ڈیمو کا حوالہ دیتے ہوئے کہا۔

OpenChatKit کے جوابات کا معیار کچھ مطلوبہ چھوڑ سکتا ہے۔ (منصفانہ طور پر، ChatGPT پرامپٹ کے لحاظ سے ڈرامائی طور پر بہتر نہیں ہیں۔) لیکن ایک ساتھ ہے فعال ہونا – یا کم از کم کوشش کر رہا ہے فعال ہونا — اعتدال پسندی کے محاذ پر۔

اگرچہ چیٹ جی پی ٹی کے خطوط پر کچھ چیٹ بوٹس کو ان کے تربیتی ڈیٹا کی وجہ سے، جن میں سے کچھ زہریلے ذرائع سے آتے ہیں، متعصب یا نفرت انگیز متن لکھنے کے لیے کہا جا سکتا ہے، اوپن چیٹ کٹ ماڈلز کو زبردستی کرنا مشکل ہے۔ میں نے انہیں ایک فشنگ ای میل لکھنے پر آمادہ کیا، لیکن انہیں زیادہ متنازعہ علاقے میں نہیں ڈالا جائے گا، جیسے ہولوکاسٹ کی توثیق کرنا یا یہ جواز پیش کرنا کہ مرد خواتین سے بہتر CEO کیوں بناتے ہیں۔

اوپن چیٹ کٹ

OpenChatKit کچھ اعتدال کا استعمال کرتا ہے، جیسا کہ یہاں دیکھا گیا ہے۔ تصویری کریڈٹ: اوپن چیٹ کٹ

اعتدال OpenChatKit کی ایک اختیاری خصوصیت ہے، حالانکہ — ڈویلپرز کو اسے استعمال کرنے کی ضرورت نہیں ہے۔ جبکہ ایک ماڈل کو دوسرے کے لیے “خاص طور پر ایک گارڈریل کے طور پر” ڈیزائن کیا گیا تھا، بڑے ماڈل — ڈیمو کو طاقت دینے والا ماڈل — پرکاش کے مطابق، بڑے ماڈل میں پہلے سے طے شدہ فلٹرنگ لاگو نہیں ہوتی ہے۔

یہ اوپن اے آئی، اینتھروپک اور دیگر کی طرف سے پسند کردہ ٹاپ-ڈاؤن اپروچ کے برعکس ہے، جس میں API کی سطح پر انسانی اور خودکار اعتدال اور فلٹرنگ کا امتزاج شامل ہے۔ پرکاش دلیل دیتے ہیں کہ یہ بند دروازوں کے پیچھے مبہم پن طویل مدت میں OpenChatKit کے لازمی فلٹر کی کمی سے زیادہ نقصان دہ ہو سکتا ہے۔

“بہت سی دوہری استعمال کی ٹیکنالوجیز کی طرح، AI کو یقینی طور پر بدنیتی پر مبنی سیاق و سباق میں استعمال کیا جا سکتا ہے۔ یہ کھلے AI، یا APIs کے ذریعے تجارتی طور پر دستیاب بند سسٹمز کے لیے درست ہے،” پرکاش نے کہا۔ “ہمارا مقالہ یہ ہے کہ کھلی تحقیقی برادری جتنی زیادہ آڈٹ، معائنہ اور جنریٹیو AI ٹیکنالوجیز کو بہتر بنا سکے گی، ہم ان خطرات کے حل کے لیے ایک معاشرے کے طور پر اتنے ہی بہتر ہوں گے۔ ہمیں یقین ہے کہ ایک ایسی دنیا جس میں بڑے جنریٹو AI ماڈلز کی طاقت صرف مٹھی بھر بڑی ٹیکنالوجی کمپنیوں کے اندر ہوتی ہے، جو آڈٹ، معائنہ یا سمجھنے سے قاصر ہے، زیادہ خطرہ لاحق ہے۔”

اوپن ڈیولپمنٹ کے بارے میں پرکاش کے نکتہ پر روشنی ڈالتے ہوئے، اوپن چیٹ کٹ میں ایک دوسرا تربیتی ڈیٹاسیٹ شامل ہے، جسے OIG-moderation کہا جاتا ہے، جس کا مقصد چیٹ بوٹ اعتدال کے چیلنجوں کی ایک حد کو حل کرنا ہے جس میں بوٹس حد سے زیادہ جارحانہ یا افسردہ لہجے کو اپناتے ہیں۔ (دیکھئے: بنگ چیٹ.) اسے OpenChatKit میں دو ماڈلز میں سے چھوٹے کو تربیت دینے کے لیے استعمال کیا گیا تھا، اور پرکاش کا کہنا ہے کہ OIG-اعتدال پسندی کو دوسرے ماڈلز بنانے کے لیے لاگو کیا جا سکتا ہے جو کہ اگر ڈویلپرز ایسا کرنے کا انتخاب کرتے ہیں تو مشکل والے متن کا پتہ لگاتے اور اسے فلٹر کرتے ہیں۔

“ہمیں اے آئی سیفٹی کے بارے میں بہت زیادہ خیال ہے، لیکن ہم سمجھتے ہیں کہ مبہمیت کے ذریعے سیکیورٹی طویل مدت میں ایک ناقص نقطہ نظر ہے۔ ایک کھلی، شفاف کرنسی کو کمپیوٹر سیکورٹی اور کرپٹوگرافی کی دنیا میں پہلے سے طے شدہ کرنسی کے طور پر بڑے پیمانے پر قبول کیا جاتا ہے، اور ہم سمجھتے ہیں کہ اگر ہم محفوظ AI بنانا چاہتے ہیں تو شفافیت بہت ضروری ہو گی،” پرکاش نے کہا۔ “ویکیپیڈیا اس بات کا ایک بہت بڑا ثبوت ہے کہ کس طرح ایک کھلی برادری بڑے پیمانے پر اعتدال پسندی کے کاموں کو چیلنج کرنے کے لیے ایک زبردست حل ہو سکتی ہے۔”

مجھے پورا یقین نہیں. شروع کرنے والوں کے لیے، ویکیپیڈیا بالکل گولڈ اسٹینڈرڈ نہیں ہے — سائٹ کا اعتدال کا عمل مشہور طور پر مبہم اور علاقائی ہے۔ پھر، حقیقت یہ ہے کہ اوپن سورس سسٹمز کا اکثر غلط استعمال کیا جاتا ہے (اور جلدی)۔ مثال کے طور پر امیج بنانے والے AI سسٹم Stable Diffusion کو لے کر، اس کی ریلیز کے دنوں کے اندر، 4chan جیسی کمیونٹیز اس ماڈل کو استعمال کر رہی تھیں – جس میں اختیاری اعتدال پسند ٹولز بھی شامل ہیں – تخلیق کرنے کے لیے۔ غیر متفقہ فحش ڈیپ فیکس مشہور اداکاروں کی.

OpenChatKit کا لائسنس واضح طور پر غلط معلومات پیدا کرنے، نفرت انگیز تقریر کو فروغ دینے، سپیمنگ اور سائبر دھونس یا ایذا رسانی میں ملوث ہونے جیسے استعمال سے منع کرتا ہے۔ لیکن بدنیتی پر مبنی اداکاروں کو ان شرائط اور اعتدال کے ٹولز دونوں کو نظر انداز کرنے سے روکنے کے لیے کچھ بھی نہیں ہے۔

بدترین کی توقع کرتے ہوئے، کچھ محققین نے کھلی رسائی والے چیٹ بوٹس پر خطرے کی گھنٹی بجانا شروع کر دی ہے۔

نیوز گارڈ، ایک کمپنی جو آن لائن غلط معلومات کو ٹریک کرتی ہے، حال ہی میں ملی مطالعہ کہ نئے چیٹ بوٹس، خاص طور پر چیٹ جی پی ٹی، کو ویکسین کے بارے میں مضر صحت دعووں کو آگے بڑھانے، چین اور روس کے پروپیگنڈے اور غلط معلومات کی نقل کرنے اور متعصب خبروں کے لہجے کی بازگشت کرنے کے لیے کہا جا سکتا ہے۔ مطالعہ کے مطابق، ChatGPT نے تقریباً 80% وقت کی تعمیل کی جب غلط اور گمراہ کن خیالات پر مبنی جوابات لکھنے کو کہا گیا۔

NewsGuard کے نتائج کے جواب میں، OpenAI نے ChatGPT کے مواد کے فلٹرز کو پچھلے حصے میں بہتر بنایا۔ یقینا، اوپن چیٹ کٹ جیسے سسٹم کے ساتھ یہ ممکن نہیں ہوگا، جو ماڈلز کو اپ ٹو ڈیٹ رکھنے کی ذمہ داری ڈویلپرز پر ڈالتا ہے۔

پرکاش اپنی دلیل پر قائم ہیں۔

انہوں نے کہا کہ “بہت سی ایپلی کیشنز کو حسب ضرورت اور تخصص کی ضرورت ہے، اور ہم سمجھتے ہیں کہ اوپن سورس اپروچ نقطہ نظر اور ایپلی کیشنز کے صحت مند تنوع کی بہتر مدد کرے گا۔” “کھلے ماڈلز بہتر ہو رہے ہیں، اور ہم ان کو اپنانے میں تیزی سے اضافہ دیکھنے کی توقع رکھتے ہیں۔”



Source link
techcrunch.com

اپنا تبصرہ بھیجیں