ویسے بھی ‘اوپن سورس AI’ کا کیا مطلب ہے؟

[ad_1]

دی اوپن سورس اور ملکیتی سافٹ ویئر کے درمیان جدوجہد اچھی طرح سمجھا جاتا ہے. لیکن تناؤ کئی دہائیوں سے سافٹ ویئر کے حلقوں میں پھیل رہا ہے۔ بدل گئے ہیں بڑھتی ہوئی مصنوعی ذہانت کی جگہ میں، گرم تعاقب میں تنازعہ کے ساتھ۔

حال ہی میں نیویارک ٹائمز ایک gushing تشخیص شائع میٹا کے سی ای او مارک زکربرگ کا، یہ نوٹ کرتے ہوئے کہ کس طرح ان کے “اوپن سورس AI” کو گلے لگانے نے انہیں سلیکون ویلی میں ایک بار پھر مقبول بنا دیا۔ مسئلہ، تاہم، یہ ہے کہ میٹا کا لاما برانڈڈ بڑے زبان کے ماڈل واقعی اوپن سورس نہیں ہیں۔.

یا وہ ہیں؟

زیادہ تر اندازوں کے مطابق، وہ نہیں ہیں۔ لیکن یہ اس بات پر روشنی ڈالتا ہے کہ کس طرح “اوپن سورس AI” کا تصور آنے والے سالوں میں مزید بحث کو ہوا دے گا۔ یہ وہ چیز ہے جو اوپن سورس انیشی ایٹو (او ایس آئی) ایگزیکٹیو ڈائریکٹر کی قیادت میں خطاب کرنے کی کوشش کر رہا ہے۔ سٹیفانو مفولی (اوپر کی تصویر)، جو کانفرنسوں، ورکشاپس، پینلز، ویبینرز، رپورٹس اور بہت کچھ پر محیط عالمی کوششوں کے ذریعے دو سالوں سے اس مسئلے پر کام کر رہا ہے۔

AI سافٹ ویئر کوڈ نہیں ہے۔

تصویری کریڈٹ: گیٹی کے ذریعے Westend61

OSI اس کا ایک ذمہ دار رہا ہے۔ اوپن سورس کی تعریف (OSD) ایک چوتھائی صدی سے زیادہ کے لیے، یہ طے کر رہا ہے کہ کس طرح “اوپن سورس” کی اصطلاح سافٹ ویئر پر لاگو کی جا سکتی ہے، یا ہونی چاہیے۔ ایک لائسنس جو اس تعریف پر پورا اترتا ہے اسے قانونی طور پر “اوپن سورس” سمجھا جا سکتا ہے، حالانکہ یہ ایک کو تسلیم کرتا ہے۔ لائسنس کی سپیکٹرم انتہائی اجازت دینے سے لے کر کافی حد تک اجازت نہیں دینے والا۔

لیکن میراثی لائسنسنگ اور نام دینے کے کنونشن کو سافٹ ویئر سے AI پر منتقل کرنا مشکل ہے۔ جوزف جیکس، اوپن سورس مبشر اور VC فرم کے بانی او ایس ایس کیپٹل، جہاں تک یہ کہنا ہے کہ وہاں ہے “اوپن سورس AI جیسی کوئی چیز نہیں۔یہ نوٹ کرتے ہوئے کہ “اوپن سورس کو واضح طور پر سافٹ ویئر سورس کوڈ کے لیے ایجاد کیا گیا تھا۔”

اس کے برعکس میں، “اعصابی نیٹ ورک وزن” (NNWs) – ایک اصطلاح جو مصنوعی ذہانت کی دنیا میں ان پیرامیٹرز یا گتانکوں کو بیان کرنے کے لیے استعمال ہوتی ہے جن کے ذریعے نیٹ ورک تربیتی عمل کے دوران سیکھتا ہے — سافٹ ویئر کے مقابلے میں کسی معنی خیز طریقے سے نہیں ہے۔

نیورل نیٹ وزن سافٹ ویئر سورس کوڈ نہیں ہیں۔ وہ انسانوں کے ذریعے پڑھنے کے قابل نہیں ہیں، اور نہ ہی وہ ڈیبگ کرنے کے قابل ہیں،” جیکس نوٹ کرتے ہیں۔ “مزید برآں، اوپن سورس کے بنیادی حقوق بھی NNWs میں کسی بھی موافق طریقے سے ترجمہ نہیں کرتے ہیں۔”

اس نے جیکس اور او ایس ایس کیپٹل کے ساتھی کی قیادت کی۔ ہیدر میکر کو اپنی قسم کی اپنی تعریف کے ساتھ آئیں، “کھلے وزن” کے تصور کے ارد گرد۔

لہذا اس سے پہلے کہ ہم “اوپن سورس AI” کی معنی خیز تعریف پر پہنچ جائیں، ہم وہاں جانے کی کوشش میں پہلے سے ہی کچھ موروثی تناؤ دیکھ سکتے ہیں۔ ہم کسی تعریف پر کیسے متفق ہو سکتے ہیں اگر ہم اس بات سے اتفاق نہیں کر سکتے کہ جس “چیز” کی ہم تعریف کر رہے ہیں وہ موجود ہے؟

Mafulli، اس کے قابل ہے، اتفاق کرتا ہے.

“نقطہ درست ہے،” اس نے ٹیک کرنچ کو بتایا۔ “ہمارے پاس ابتدائی بحثوں میں سے ایک یہ تھی کہ کیا اسے اوپن سورس AI کہا جائے، لیکن ہر کوئی پہلے سے ہی اس اصطلاح کا استعمال کر رہا تھا۔”

یہ وسیع تر AI دائرے میں کچھ چیلنجوں کی عکاسی کرتا ہے، جہاں اس بات پر بحثیں ہوتی رہتی ہیں کہ آیا وہ چیز جسے ہم آج “AI” کہہ رہے ہیں۔ واقعی AI ہے یا صرف طاقتور سسٹمز کو ڈیٹا کے وسیع حصّوں کے درمیان پیٹرن تلاش کرنا سکھایا جاتا ہے۔ لیکن ناقدین زیادہ تر اس حقیقت سے مستعفی ہوجاتے ہیں کہ “AI” کا نام یہاں ہے، اور اس سے لڑنے کا کوئی فائدہ نہیں ہے۔

لاما کی مثال
تصویری کریڈٹ: لاریسا اموسووا بذریعہ گیٹی

1998 میں قائم کیا گیا، OSI ایک غیر منافع بخش عوامی فائدہ کارپوریشن ہے جو وکالت، تعلیم اور اس کی بنیادی وجہ: اوپن سورس ڈیفینیشن کے ارد گرد اوپن سورس سے متعلق بے شمار سرگرمیوں پر کام کرتی ہے۔ آج، تنظیم ایمیزون، گوگل، مائیکروسافٹ، سسکو، انٹیل، سیلز فورس اور میٹا جیسے معزز اراکین کے ساتھ فنڈنگ ​​کے لیے کفالت پر انحصار کرتی ہے۔

OSI کے ساتھ میٹا کی شمولیت اس وقت خاص طور پر قابل ذکر ہے کیونکہ یہ “اوپن سورس AI” کے تصور سے متعلق ہے۔ میٹا نے اپنی AI ٹوپی لٹکانے کے باوجود اوپن سورس پیگ پر، کمپنی پر اس حوالے سے قابل ذکر پابندیاں ہیں کہ اس کے لاما ماڈلز کو کس طرح استعمال کیا جا سکتا ہے: یقیناً، انہیں تحقیق اور تجارتی استعمال کے معاملات کے لیے مفت استعمال کیا جا سکتا ہے، لیکن 700 ملین سے زیادہ ماہانہ صارفین والے ایپ ڈویلپرز کو میٹا سے خصوصی لائسنس کی درخواست کرنی چاہیے، جو یہ خالصتاً اپنی صوابدید پر دے گا۔

سیدھے الفاظ میں، میٹا کے بگ ٹیک برادران اگر چاہیں تو سیٹی بجا سکتے ہیں۔

اس کے LLMs کے ارد گرد میٹا کی زبان کسی حد تک خراب ہے۔ جبکہ کمپنی نے اس کا فون کیا۔ لاما 2 ماڈل اوپن سورس، کے ساتہ لامہ کی آمد 3 اپریل میں، یہ اصطلاحات سے کسی حد تک پیچھے ہٹ گیا، جملے کا استعمال کرتے ہوئے جیسا کہ اس کے بجائے “کھلی طور پر دستیاب” اور “کھلی طور پر قابل رسائی”۔ لیکن کچھ جگہوں پر، یہ اب بھی حوالہ دیتا ہے ماڈل بطور “اوپن سورس”۔

مفولی نے کہا کہ “بات چیت میں شامل ہر کوئی اس بات پر پوری طرح متفق ہے کہ لامہ کو خود کو اوپن سورس نہیں سمجھا جا سکتا،” مفولی نے کہا۔ “جن لوگوں سے میں نے بات کی ہے جو میٹا میں کام کرتے ہیں، وہ جانتے ہیں کہ یہ تھوڑا سا کھینچا تانی ہے۔”

اس کے اوپری حصے میں، کچھ لوگ بحث کر سکتے ہیں کہ یہاں مفادات کا تصادم ہے: ایک کمپنی جس نے اوپن سورس برانڈنگ کو بند کرنے کی خواہش ظاہر کی ہے وہ بھی “تعریف” کے ذمہ داروں کو مالیات فراہم کرتی ہے؟

یہ ایک وجہ ہے کہ OSI اپنی فنڈنگ ​​کو متنوع بنانے کی کوشش کر رہا ہے، حال ہی میں اس سے گرانٹ حاصل کر رہا ہے۔ سلوان فاؤنڈیشن، جو اوپن سورس AI ڈیفینیشن تک پہنچنے کے لیے اس کے ملٹی اسٹیک ہولڈر گلوبل پش کو فنڈ دینے میں مدد کر رہا ہے۔ TechCrunch اس گرانٹ کی رقم تقریباً $250,000 ظاہر کر سکتا ہے، اور Maffulli کو امید ہے کہ یہ کارپوریٹ فنڈنگ ​​پر انحصار کے ارد گرد آپٹکس کو تبدیل کر سکتا ہے۔

“یہ ان چیزوں میں سے ایک ہے جسے سلوان گرانٹ اور بھی واضح کرتا ہے: ہم کسی بھی وقت میٹا کے پیسے کو الوداع کہہ سکتے ہیں،” مفولی نے کہا۔ “ہم اس سلوان گرانٹ سے پہلے بھی ایسا کر سکتے تھے، کیونکہ میں جانتا ہوں کہ ہمیں دوسروں سے عطیات ملیں گے۔ اور میٹا یہ اچھی طرح جانتا ہے۔ وہ اس میں سے کسی میں مداخلت نہیں کر رہے ہیں۔ [process]، نہ ہی مائیکروسافٹ، یا GitHub یا Amazon یا Google – وہ بالکل جانتے ہیں کہ وہ مداخلت نہیں کر سکتے، کیونکہ تنظیم کا ڈھانچہ اس کی اجازت نہیں دیتا۔”

اوپن سورس AI کی ورکنگ ڈیفینیشن

تصور کی مثال ایک تعریف تلاش کرنے کی عکاسی کرتی ہے۔
تصویری کریڈٹ: الیکسی موروزوف / گیٹی امیجز

موجودہ اوپن سورس AI ڈیفینیشن ڈرافٹ اس پر بیٹھا ہے۔ ورژن 0.0.8, تین بنیادی حصوں پر مشتمل ہے: “تمہینہ”، جو دستاویز کی ترسیل کو بیان کرتا ہے؛ اوپن سورس AI کی تعریف خود اور ایک چیک لسٹ جو اوپن سورس کے مطابق AI سسٹم کے لیے درکار اجزاء سے گزرتی ہے۔

موجودہ مسودے کے مطابق، اوپن سورس اے آئی سسٹم کو اجازت کے بغیر کسی بھی مقصد کے لیے سسٹم کو استعمال کرنے کی آزادی دینی چاہیے۔ دوسروں کو اس بات کا مطالعہ کرنے کی اجازت دینا کہ نظام کیسے کام کرتا ہے اور اس کے اجزاء کا معائنہ کرتا ہے۔ اور کسی بھی مقصد کے لیے نظام میں ترمیم اور اشتراک کرنا۔

لیکن ایک سب سے بڑا چیلنج ڈیٹا کے ارد گرد رہا ہے – یعنی، کیا کسی AI سسٹم کو “اوپن سورس” کے طور پر درجہ بندی کیا جا سکتا ہے اگر کمپنی نے تربیتی ڈیٹا سیٹ دوسروں کے لیے دستیاب نہیں کرایا ہے؟ Maffulli کے مطابق، یہ جاننا زیادہ اہم ہے کہ ڈیٹا کہاں سے آیا، اور کس طرح ایک ڈویلپر نے ڈیٹا کو لیبل، ڈی ڈپلیکیٹ اور فلٹر کیا۔ اور اس کے علاوہ، اس کوڈ تک رسائی حاصل کرنا جو ڈیٹاسیٹ کو اس کے مختلف ذرائع سے جمع کرنے کے لیے استعمال کیا جاتا تھا۔

مفولی نے کہا کہ “اس معلومات کو جاننا زیادہ بہتر ہے کہ اس کے بغیر سادہ ڈیٹا سیٹ ہو،” Maffulli نے کہا۔

اگرچہ مکمل ڈیٹاسیٹ تک رسائی حاصل کرنا اچھا ہوگا (او ایس آئی اسے ایک “اختیاری” جزو بناتا ہے)، مفولی کہتے ہیں کہ یہ بہت سے معاملات میں ممکن یا عملی نہیں ہے۔ اس کی وجہ یہ ہو سکتی ہے کہ ڈیٹاسیٹ کے اندر خفیہ یا کاپی رائٹ والی معلومات موجود ہے جسے ڈیولپر کو دوبارہ تقسیم کرنے کی اجازت نہیں ہے۔ مزید برآں، مشین لرننگ ماڈلز کو تربیت دینے کی تکنیکیں موجود ہیں جن کے تحت فیڈریٹڈ لرننگ، ڈیفرینشل پرائیویسی اور ہومومورفک انکرپشن جیسی تکنیکوں کا استعمال کرتے ہوئے خود ڈیٹا کو سسٹم کے ساتھ شیئر نہیں کیا جاتا ہے۔

اور یہ “اوپن سورس سافٹ ویئر” اور “اوپن سورس AI” کے درمیان بنیادی فرق کو بالکل واضح کرتا ہے: ارادے ایک جیسے ہو سکتے ہیں، لیکن وہ ایک جیسے نہیں ہیں، اور اس تفاوت کو OSI اپنے اندر حاصل کرنے کی کوشش کر رہا ہے۔ تعریف

سافٹ ویئر میں، سورس کوڈ اور بائنری کوڈ ایک ہی نمونے کے دو نظریات ہیں: وہ ایک ہی پروگرام کو مختلف شکلوں میں ظاہر کرتے ہیں۔ لیکن تربیتی ڈیٹاسیٹ اور اس کے بعد تربیت یافتہ ماڈل الگ الگ چیزیں ہیں: آپ وہی ڈیٹاسیٹ لے سکتے ہیں، اور ضروری نہیں کہ آپ ایک ہی ماڈل کو مستقل طور پر دوبارہ تخلیق کرسکیں گے۔

Maffulli نے مزید کہا، “ٹریننگ کے دوران مختلف شماریاتی اور بے ترتیب منطق ہوتی ہے جس کا مطلب ہے کہ یہ اسے سافٹ ویئر کی طرح نقل کرنے کے قابل نہیں بنا سکتا۔”

لہذا اوپن سورس AI سسٹم کو واضح ہدایات کے ساتھ نقل کرنا آسان ہونا چاہئے۔ اور یہ وہ جگہ ہے جہاں اوپن سورس AI ڈیفینیشن کا چیک لسٹ پہلو کام میں آتا ہے، جو کہ a پر مبنی ہے۔ حال ہی میں شائع شدہ تعلیمی مقالہ “ماڈل اوپننس فریم ورک: مصنوعی ذہانت میں تولیدی صلاحیت، شفافیت، اور استعمال کے لیے مکمل اور کھلے پن کو فروغ دینا۔”

یہ مقالہ ماڈل اوپننس فریم ورک (MOF) کی تجویز پیش کرتا ہے، ایک درجہ بندی کا نظام جو مشین لرننگ ماڈلز کو “ان کی مکمل اور کھلے پن کی بنیاد پر” درجہ دیتا ہے۔ MOF کا مطالبہ ہے کہ AI ماڈل کی ترقی کے مخصوص اجزاء کو “مناسب اوپن لائسنسوں کے تحت شامل اور جاری کیا جائے”، بشمول ٹریننگ کے طریقہ کار اور ماڈل پیرامیٹرز کے ارد گرد تفصیلات۔

مستحکم حالت

اسٹیفانو مفولی ادیس ابابا میں ڈیجیٹل پبلک گڈز الائنس (DPGA) کے اراکین کے سربراہی اجلاس میں پیش کرتے ہوئے
اسٹیفانو مفولی ادیس ابابا میں ڈیجیٹل پبلک گڈز الائنس (DPGA) کے اراکین کے سربراہی اجلاس میں پیش کر رہے ہیں۔
تصویری کریڈٹ: او ایس آئی

OSI تعریف کے باضابطہ آغاز کو “مستحکم ورژن” قرار دے رہا ہے، جیسا کہ کوئی کمپنی کسی ایسی ایپلی کیشن کے ساتھ کرے گی جس کی پرائم ٹائم سے پہلے وسیع پیمانے پر جانچ اور ڈیبگنگ ہوئی ہو۔ OSI جان بوجھ کر اسے “حتمی ریلیز” نہیں کہہ رہا ہے کیونکہ اس کے کچھ حصے تیار ہونے کا امکان ہے۔

“ہم واقعی یہ توقع نہیں کر سکتے کہ یہ تعریف اوپن سورس ڈیفینیشن کی طرح 26 سال تک رہے گی،” مفولی نے کہا۔ “میں تعریف کے سب سے اوپر والے حصے کی توقع نہیں کرتا – جیسے ‘AI سسٹم کیا ہے؟’ – بہت زیادہ تبدیل کرنے کے لئے. لیکن ہم چیک لسٹ میں جن حصوں کا حوالہ دیتے ہیں، ان اجزاء کی فہرست ٹیکنالوجی پر منحصر ہے؟ کل، کون جانتا ہے کہ ٹیکنالوجی کیسی نظر آئے گی۔”

توقع ہے کہ مستحکم اوپن سورس AI ڈیفینیشن پر بورڈ کے ذریعہ ربڑ کی مہر لگائی جائے گی۔ آل تھنگز اوپن کانفرنس اکتوبر کے آخر میں، OSI نے پانچ براعظموں پر محیط درمیانی مہینوں میں ایک عالمی روڈ شو شروع کرنے کے ساتھ، مزید “متنوع ان پٹ” کی تلاش میں کہ کس طرح “اوپن سورس AI” کو آگے بڑھنے کی تعریف کی جائے گی۔ لیکن کوئی بھی حتمی تبدیلی یہاں اور وہاں “چھوٹے موافقت” سے تھوڑی زیادہ ہونے کا امکان ہے۔

مفولی نے کہا، ’’یہ آخری سلسلہ ہے۔ “ہم تعریف کے فیچر مکمل ورژن تک پہنچ چکے ہیں۔ ہمارے پاس وہ تمام عناصر ہیں جن کی ہمیں ضرورت ہے۔ اب ہمارے پاس ایک چیک لسٹ ہے، لہذا ہم چیک کر رہے ہیں کہ وہاں کوئی حیرت تو نہیں ہے۔ ایسا کوئی نظام نہیں ہے جسے شامل یا خارج کیا جائے۔”

[ad_2]

Source link
techcrunch.com

اپنا تبصرہ بھیجیں