blank

روبوٹسٹ کس طرح تخلیقی AI کے بارے میں سوچ رہے ہیں۔

[A version of this piece first appeared in TechCrunch’s robotics newsletter, Actuator. Subscribe here.]

جنریٹو AI کا موضوع میرے نیوز لیٹر، Actuator میں کثرت سے آتا ہے۔ میں تسلیم کرتا ہوں کہ کچھ مہینے پہلے میں اس موضوع پر زیادہ وقت گزارنے میں تھوڑا ہچکچا رہا تھا۔ کوئی بھی جو ٹکنالوجی پر رپورٹنگ کر رہا ہے جب تک کہ میں نے لاتعداد ہائپ سائیکلوں سے گزرا ہے اور اس سے پہلے جلا دیا گیا ہے۔ ٹیک پر رپورٹنگ کے لیے شکوک و شبہات کی صحت مند خوراک کی ضرورت ہوتی ہے، امید ہے کہ کیا کیا جا سکتا ہے اس کے بارے میں کچھ جوش و خروش سے غصہ آیا۔

اس بار، ایسا لگتا تھا کہ تخلیقی AI پنکھوں میں انتظار کر رہا ہے، اپنے وقت کی پابندی کر رہا ہے، کرپٹو کے ناگزیر کریٹرنگ کا انتظار کر رہا ہے۔ جیسے ہی اس زمرے سے خون بہہ رہا تھا، ChatGPT اور DALL-E جیسے پروجیکٹس ساتھ کھڑے تھے، جو سانس کے بغیر رپورٹنگ، امید، تنقید، ڈومرزم اور ٹیک ہائپ ببل کے تمام مختلف Kübler-Rossian مراحل کا مرکز بننے کے لیے تیار تھے۔

جو لوگ میری چیزوں کی پیروی کرتے ہیں وہ جانتے ہیں کہ میں کبھی بھی خاص طور پر کرپٹو پر تیز نہیں تھا۔ تاہم، جنریٹیو AI کے ساتھ چیزیں مختلف ہیں۔ شروع کرنے والوں کے لیے، قریب قریب ایک عالمی معاہدہ ہے کہ مصنوعی ذہانت/مشین لرننگ وسیع پیمانے پر ہماری زندگیوں میں مزید مرکزی کردار ادا کرے گی۔

اسمارٹ فونز یہاں بڑی بصیرت پیش کرتے ہیں۔ کمپیوٹیشنل فوٹو گرافی ایک ایسی چیز ہے جس کے بارے میں میں کسی حد تک باقاعدگی سے لکھتا ہوں۔ حالیہ برسوں میں اس محاذ پر بڑی پیشرفت ہوئی ہے، اور میرے خیال میں بہت سے مینوفیکچررز نے آخر کار ہارڈ ویئر اور سافٹ ویئر کے درمیان ایک اچھا توازن قائم کر لیا ہے جب یہ حتمی مصنوعات کو بہتر بنانے اور داخلے کی بار کو کم کرنے کی بات آتی ہے۔ گوگل، مثال کے طور پر، ترمیم کی خصوصیات کے ساتھ کچھ واقعی متاثر کن چالوں کو کھینچتا ہے۔ بہترین ٹیک اور میجک ایریزر.

یقینی طور پر، وہ صاف چالیں ہیں، لیکن وہ خصوصیات کی خاطر خصوصیات بننے کے بجائے مفید بھی ہیں۔ آگے بڑھنا، تاہم، اصل چال انہیں بغیر کسی رکاوٹ کے تجربے میں ضم کر دے گی۔ مثالی مستقبل کے ورک فلو کے ساتھ، زیادہ تر صارفین کو پردے کے پیچھے کیا ہو رہا ہے اس کے بارے میں بہت کم یا کوئی تصور نہیں ہوگا۔ وہ صرف خوش ہوں گے کہ یہ کام کرتا ہے۔ یہ ایپل کی کلاسک پلے بک ہے۔

جنریٹو اے آئی گیٹ کے باہر اسی طرح کا “واہ” اثر پیش کرتا ہے، جو ایک اور طریقہ ہے جو اس کے ہائپ سائیکل پیشرو سے مختلف ہے۔ جب آپ کا کم سے کم ٹیک جاننے والا رشتہ دار کمپیوٹر پر بیٹھ سکتا ہے، تو ڈائیلاگ فیلڈ میں کچھ الفاظ ٹائپ کریں اور پھر دیکھیں کہ بلیک باکس پینٹنگز اور مختصر کہانیوں کو باہر نکالتا ہے، تو بہت زیادہ تصور کی ضرورت نہیں ہے۔ یہ اس وجہ کا ایک بڑا حصہ ہے کہ یہ سب کچھ جتنی جلدی پکڑا گیا تھا — اکثر اوقات جب روزمرہ کے لوگوں کو جدید ترین ٹیکنالوجی مل جاتی ہے، تو اس کے لیے انہیں یہ تصور کرنے کی ضرورت ہوتی ہے کہ یہ سڑک کے نیچے پانچ یا 10 سال کی طرح نظر آتی ہے۔

ChatGPT، DALL-E، وغیرہ کے ساتھ، آپ ابھی خود ہی اس کا تجربہ کر سکتے ہیں۔ یقینا، اس کا دوسرا پہلو یہ ہے کہ توقعات پر قابو پانا کتنا مشکل ہو جاتا ہے۔ جیسا کہ لوگ AI کی بنیادی سمجھ کے بغیر، انسانی یا حیوانی ذہانت کے ساتھ روبوٹس کو امبیو کرنے کی طرف مائل ہوتے ہیں، یہاں پر جان بوجھ کر پیش کرنا آسان ہے۔ لیکن اب معاملات ایسے ہی چل رہے ہیں۔ ہم توجہ دلانے والی سرخی کے ساتھ رہنمائی کرتے ہیں اور امید کرتے ہیں کہ لوگ اس کے پیچھے ہونے والی سازشوں کے بارے میں پڑھنے کے لیے کافی دیر تک قائم رہیں گے۔

سپوئلر الرٹ: 10 میں سے نو بار ایسا نہیں کریں گے، اور اچانک ہم چیزوں کو حقیقت کی طرف لے جانے کی کوشش میں مہینوں اور سال گزار رہے ہیں۔

میرے کام کے اچھے فوائد میں سے ایک ان چیزوں کو مجھ سے زیادہ ہوشیار لوگوں کے ساتھ توڑنے کی صلاحیت ہے۔ وہ چیزوں کی وضاحت کرنے میں وقت لگاتے ہیں اور امید ہے کہ میں قارئین کے لیے ترجمہ کرنے میں ایک اچھا کام کروں گا (کچھ کوششیں دوسروں سے زیادہ کامیاب ہوتی ہیں)۔

ایک بار جب یہ واضح ہو گیا کہ روبوٹکس کے مستقبل میں جنریٹیو AI کا ایک اہم کردار ہے، میں بات چیت میں سوالات کو جوتوں کے نشان کے طریقے تلاش کر رہا ہوں۔ میں نے محسوس کیا کہ فیلڈ میں زیادہ تر لوگ پچھلے جملے میں بیان سے اتفاق کرتے ہیں، اور ان کے خیال میں اس کے اثرات کی وسعت کو دیکھنا دلچسپ ہے۔

مثال کے طور پر، میرے میں مارک رائبرٹ اور گل پریٹ کے ساتھ حالیہ گفتگو، مؤخر الذکر نے وضاحت کی کہ تخلیقی AI روبوٹ سیکھنے کے اپنے نقطہ نظر میں کیا کردار ادا کر رہا ہے:

ہم نے یہ جان لیا ہے کہ کچھ کیسے کرنا ہے، جس میں جدید تخلیقی AI تکنیکوں کا استعمال کیا جاتا ہے جو کہ صرف چند مثالوں سے روبوٹ کو بنیادی طور پر سکھانے کے لیے پوزیشن اور قوت دونوں کے انسانی مظاہرے کے قابل بناتی ہے۔ کوڈ بالکل تبدیل نہیں ہوا ہے۔ یہ جس چیز پر مبنی ہے اسے ڈفیوژن پالیسی کہا جاتا ہے۔ یہ وہ کام ہے جو ہم نے کولمبیا اور MIT کے ساتھ مل کر کیا ہے۔ ہم نے اب تک 60 مختلف ہنر سکھائے ہیں۔

پچھلا ہفتہ، جب میں نے Nvidia کے VP اور Embedded and Edge Computing کے GM، Deepu Talla سے پوچھا کہ کمپنی کیوں مانتی ہے کہ جنریٹو AI ایک شوق سے زیادہ ہے، تو اس نے مجھے بتایا:

میرے خیال میں یہ نتائج میں بولتا ہے۔ آپ پہلے ہی پیداوری میں بہتری دیکھ سکتے ہیں۔ یہ میرے لیے ایک ای میل تحریر کر سکتا ہے۔ یہ بالکل ٹھیک نہیں ہے، لیکن مجھے صفر سے شروع کرنے کی ضرورت نہیں ہے۔ یہ مجھے 70٪ دے رہا ہے۔ ایسی واضح چیزیں ہیں جو آپ پہلے ہی دیکھ سکتے ہیں جو یقینی طور پر اس سے بہتر ہے کہ چیزیں پہلے کی طرح تھیں۔ کسی چیز کا خلاصہ کرنا کامل نہیں ہے۔ میں اسے پڑھنے اور اپنے لیے خلاصہ کرنے نہیں دوں گا۔ لہذا، آپ پہلے ہی پیداوری میں بہتری کے کچھ آثار دیکھ سکتے ہیں۔

دریں اثنا، میرے دوران ڈینیلا روس کے ساتھ آخری گفتگو، MIT CSAIL کے سربراہ نے وضاحت کی کہ کس طرح محققین روبوٹ کو اصل میں ڈیزائن کرنے کے لیے جنریٹیو AI استعمال کر رہے ہیں:

اس سے پتہ چلتا ہے کہ جنریٹو AI حرکت کی منصوبہ بندی کے مسائل کو حل کرنے کے لیے کافی طاقتور ہو سکتا ہے۔ آپ ماڈل پیشن گوئی کے حل کے مقابلے میں بہت تیز حل اور کنٹرول کے لیے بہت زیادہ سیال اور انسان نما حل حاصل کر سکتے ہیں۔ مجھے لگتا ہے کہ یہ بہت طاقتور ہے، کیونکہ مستقبل کے روبوٹ بہت کم روبوٹائز ہوں گے۔ وہ اپنی حرکات میں بہت زیادہ سیال اور انسان نما ہوں گے۔

ہم نے ڈیزائن کے لیے جنریٹو AI کا بھی استعمال کیا ہے۔ یہ بہت طاقتور ہے۔ یہ بہت دلچسپ بھی ہے، کیونکہ یہ صرف روبوٹ کے لیے پیٹرن جنریشن نہیں ہے۔ آپ کو کچھ اور کرنا ہوگا۔ یہ صرف ڈیٹا کی بنیاد پر پیٹرن نہیں بنا سکتا۔ مشینوں کو فزکس اور طبعی دنیا کے تناظر میں سمجھنا پڑتا ہے۔ اس وجہ سے، ہم انہیں طبیعیات پر مبنی سمولیشن انجن سے جوڑتے ہیں تاکہ یہ یقینی بنایا جا سکے کہ ڈیزائن ان کی مطلوبہ رکاوٹوں کو پورا کرتے ہیں۔

اس ہفتے، نارتھ ویسٹرن یونیورسٹی میں ایک ٹیم اپنی تحقیق کا پردہ فاش کیا۔ AI سے تیار کردہ روبوٹ ڈیزائن میں۔ محققین نے یہ ظاہر کیا کہ انہوں نے “صرف سیکنڈوں میں کامیابی سے چلنے والا روبوٹ” کیسے ڈیزائن کیا۔ یہ دیکھنے کے لئے زیادہ نہیں ہے، جیسا کہ یہ چیزیں چلتی ہیں، لیکن یہ دیکھنا کافی آسان ہے کہ اضافی تحقیق کے ساتھ، نقطہ نظر کو مزید پیچیدہ نظام بنانے کے لیے کیسے استعمال کیا جا سکتا ہے۔

تحقیق کے سربراہ سیم کریگ مین نے کہا، “ہم نے ایک بہت تیز رفتار AI سے چلنے والا ڈیزائن الگورتھم دریافت کیا جو انسانی ڈیزائنرز کے تعصب پر پیچھے پڑے بغیر، ارتقاء کے ٹریفک جام کو نظرانداز کرتا ہے۔” “ہم نے AI کو بتایا کہ ہمیں ایک ایسا روبوٹ چاہیے جو زمین پر چل سکے۔ پھر ہم نے صرف ایک بٹن دبایا اور پریسٹو! اس نے پلک جھپکتے ہی ایک روبوٹ کے لیے بلیو پرنٹ تیار کیا جو زمین پر چلنے والے کسی بھی جانور کی طرح نظر نہیں آتا۔ میں اس عمل کو ‘فوری ارتقا’ کہتا ہوں۔

چھوٹے، اسکویش روبوٹ پر ٹانگیں رکھنا AI پروگرام کا انتخاب تھا۔ “یہ دلچسپ ہے کیونکہ ہم نے اے آئی کو نہیں بتایا کہ روبوٹ کی ٹانگیں ہونی چاہئیں،” کریگ مین نے مزید کہا۔ “اس نے دوبارہ دریافت کیا کہ ٹانگیں زمین پر گھومنے پھرنے کا ایک اچھا طریقہ ہیں۔ ٹانگوں والی حرکت دراصل زمینی حرکت کی سب سے موثر شکل ہے۔

فارمینٹ کے بانی اور سی ای او جیف لِنیل نے اس ہفتے مجھے بتایا کہ “میرے نقطہ نظر سے، تخلیقی AI اور جسمانی آٹومیشن/روبوٹکس وہ سب کچھ بدل دیں گے جو ہم زمین پر زندگی کے بارے میں جانتے ہیں۔” “مجھے لگتا ہے کہ ہم سب اس حقیقت کے بارے میں ہپ ہیں کہ AI ایک چیز ہے اور توقع کر رہے ہیں کہ ہماری ہر ملازمت، ہر کمپنی اور طالب علم متاثر ہوں گے۔ مجھے لگتا ہے کہ یہ روبوٹکس کے ساتھ علامتی ہے۔ آپ کو روبوٹ پروگرام کرنے کی ضرورت نہیں ہے۔ آپ روبوٹ سے انگریزی میں بات کرنے جا رہے ہیں، کارروائی کی درخواست کریں گے اور پھر اس کا پتہ چل جائے گا۔ اس کے لیے ایک منٹ لگے گا۔‘‘

فارمینٹ سے پہلے، Linnell نے Bot & Dolly کی بنیاد رکھی اور بطور CEO خدمات انجام دیں۔ سان فرانسسکو میں مقیم فرم، جو کہ کشش ثقل پر اپنے کام کے لیے مشہور ہے، کو گوگل نے 2013 میں اس وقت گھیر لیا تھا جب سافٹ ویئر دیو نے صنعت کو تیز کرنے (بہترین منصوبہ بندی، وغیرہ) پر اپنی نگاہیں مرکوز کی تھیں۔ ایگزیکٹو مجھے بتاتا ہے کہ اس تجربے سے اس کا کلیدی فائدہ یہ ہے کہ یہ سب سافٹ ویئر کے بارے میں ہے (ڈیپ مائنڈ میں داخلی اور روزانہ روبوٹس کے جذب ہونے کے پیش نظر، میں یہ کہنے پر مائل ہوں کہ گوگل اس سے متفق ہے)۔



Source link
techcrunch.com

اپنا تبصرہ بھیجیں