🧑‍💻 "اس ChatGPT کو کیوں ہر فن مولا سمجھ بیٹھے ہو؟

؟"


نوٹ-->👈 اس تحریر میں مرچ مصالحہ بہت کم ہوگا  حقیقت اور تکنیکی باریکیاں زیادہ ہوں گی--


آج کل ChatGPT کی بہت دھوم ہے، اس کو ہر مسئلے کا حل بتا کر دکھایا جا رہا ہے اور مصنوعی ذہانت (Artificial intelligence) کا ایک شاہکار دکھایا جا رہا ہے۔ پچھلے سال نومبر میں جب OpenAI کمپنی نے اس ChatGPT کے پیچھے کارفرما GPT کا ورژن 3 نکالا تو 5 دن کے اندر ہی 10 کروڑ سے زیادہ لوگوں نے اس کو استعمال کرنا شروع کردیا۔ مائیکروسافٹ جو 2019 سے اس کمپنی میں ایک سرمایہ کار تھا، 2022 میں OpenAI کو خرید لیا اور اب GPT کا ورژن 4 نکالنے جارہا ہے جس میں اس کی طاقت اور خصوصیات کو بتایا جارہا ہے کہ انتہائی حیران کن ہوں گی۔ چلیں اس کو دیکھتے ہیں کہ کیا کچھ نیا ہوسکتا ہے اور اس میں کتنی سچائی ہے۔ اس سے پہلے ایک عام آدمی کے لیے یہ بتانا چاہوں گا کہ یہ اصل میں یہ ہے کیا۔


یہ ChatGPT کیا ہے؟

یہ ایک Artificial Intelligent chatbot ہے۔ یہاں دو چیزیں ہیں ایک AI یعنی مصنوعی ذہین اور دوسری chatbot. مصنوعی ذہین سے مراد کوئی بھی ایسی مشین یا سسٹم جس میں انسانی ذہانت جیسی کچھ خصوصیات پائی جائیں جیسے جملوں کو سمجھنا، ان کا جواب دینا، تصویر کو سمجھ لینا اس کے مطابق کوئی عمل کرنا، نیچرل لینگویج کو سمجھ کر عمل کرنا وغیرہ۔ AI ہر جگہ استعمال ہو رہی ہے جیسے یوٹیوب، نیٹفلکس، ایمازون، گوگل سرچ۔ لیکن یہ یاد رکھیں کہ یہ ذہانت اصل میں وہ ذہانت نہیں ہے جو انسان کے پاس ہے جس میں انسان کسی بھی ڈیٹا کے بغیر یا بہت کم ڈیٹا کے ساتھ فیصلے کرسکتا ہے۔ اس کو Artificial General Intelligence یا AGI کہا جاتا ہے جو ابھی کسی بھی مشین کے لیے ممکن نہیں ہوا کہ مشین خود سے سوچنے لگ جائے۔ 

یہ مصنوعی ذہین مشینیں یا چیٹ بوٹ ایک Language Model پر کام کرتے ہیں جس میں Natural Language Processing کا استعمال کرکے دیے گئے سوالات کا جواب ڈھونڈا جاتا ہے۔ اب جس کے پاس جتنا زیادہ ڈیٹا ہوگا اور جتنی زیادہ اس سسٹم کی ٹریننگ ہوگی وہ اتنا زیادہ نیچرل جواب دے گا۔ 


--یہ Language Model کیا ہے؟

جب بھی کوئی چیٹ بوٹ یا مصنوعی ذہین سسٹم بنایا جاتا ہے تو ایک چھوٹے بچے کی طرح اس کو سب کچھ سکھانا پڑتا ہے لیکن اس کے سیکھنے کی طاقت کروڑوں گنا زیادہ ہوتی ہے مثلاً 2018 میں GPT ورژن 1 کی ٹریننگ کے لیے BookCorpus ڈیٹا سیٹ استعمال کیا گیا تھا جس میں 7000 کتابوں کے برابر تحریریں تھی جو اس  کو سکھائی گئیں۔ اس ڈیٹا سیٹ میں 12 کروڑ الفاظ تھے۔ اور یہ ڈیٹا سیٹ University of Toronto کے ماہرین نے بنایا تھا۔ اب ایک اور چیز جس سے مل کر یہ لینگویج ماڈل بنتا ہے اس کو Neural network کہتے ہیں۔


--یہ Neural network کیا ہے؟

ان تمام الفاظ کا آپس میں رابطہ، واسطہ ہوتا ہے جو ایک جیسے الفاظ، ایسے الفاظ جو کسی نا کسی طرح آپس میں تعلق رکھتے ہوں جیسے 'ماں' کا تعلق 'خاندان' سے ان کا ایک نیٹورک بنتا ہے جس کو Artificial Neural Network کہا جاتا ہے، یہ ANN ہی اس Language Model کی روح ہے جس پر کوئی مصنوعی ذہانت والا سسٹم کھڑا ہوتا ہے۔ جیسے انسانی دماغ میں Biological Neural network ہوتا ہے جس میں نیوران کیمیائی لحاظ سے ایک دوسرے سے جڑے ہوتے ہیں اور اربوں نیورون مل کر انسانی ذہانت کو جنم دیتے ہیں ایسے ہی مصنوعی ذہانت میں بھی یہ الفاظ ایک نوڈ کی طرح (اور ساتھ میں ان پر پروسیسنگ) ایک دوسرے سے مل کر مصنوعی نیورل نیٹورک بناتے ہیں۔ یہ نیورل نیٹورک ابتدائی طور پر ٹریننگ ڈیٹا سے مل کر بنتے ہیں اور بعد ازاں ان میں وقت کے ساتھ ساتھ الفاظ شامل ہوتے رہتے ہیں۔ کسی بھی AI System کی ٹریننگ کے لیے مختلف طریقے ہیں جن میں Supervised اور Unsupervised لرننگ اور Reinforcement لرننگ شامل ہیں جن کی تفصیل یہاں غیر ضروری ہے۔


--یہ GPT کیا ہے؟

یہ GPT ایک لینگویج ماڈل ہے جس کی تفصیل اوپر پڑھ چکے ہیں آپ اور یہ Generative Pre_trained Transformerکا مخفف ہے۔ یہ لینگویج ماڈل انسانوں جیسے جواب دینے کی صلاحیت رکھتا ہے جس کو اس سے پہلے ایک بہت بڑے ڈیٹا سے ٹرین کیا گیا ہوتا ہے۔ اب یہ لفظ transformer سے کیا مراد ہے۔ یہ ایک deep learning  ماڈل ہے جو Machine Learning کا ایک چھوٹا حصہ ہے یہ نیورل نیٹورک میں موجود ہر نوڈ کو کچھ وزن (weights) دیتا ہے جو ان پٹ سے آؤٹ پٹ تک فائنل جواب کی فراہمی میں سب سے اہم کام سرانجام دیتا ہے۔ یہ ٹرانسفارمر Natural Language Processing جیسا کہ یہ چیٹ بوٹ ہیں اور Computer vision جیسی ایپلیکیشن میں ریڑھ کی ہڈی کا کام کرتا ہے۔ بہت ساری چیزیں انتہائی اختصار سے بیان کر رہا ہوں تاکہ تحریر کی طوالت آپ کو بور نا کرے۔

پہلے ورژن میں 12 کروڑ پیرامیٹرز یا نوڈز تھے۔

جب GPT-2 آنا تھا اس سے پہلے بھی یہی سب باتیں ہو رہی تھیں جو اب ورژن 4 کے آنے سے پہلے ہورہی ہیں کہ یہ ہو جائے گا وہ ہوجائے گا۔ ورژن 2 کے آنے سے پہلے کہا گیا تھا کہ اس کے بعد غیر تصدیق شدہ انفارمیشن اور خبروں کا طوفان آجائے گا، سیاسی پارٹیاں اس کو استعمال کریں گی اور لوگوں میں misinformation کا راج ہوگا۔ نومبر 2019 میں OpenAI نے ورژن 2 نکالا جس میں 40 جی بی ٹیکسٹ ڈیٹا تھا، 80 لاکھ ڈاکومنٹس، اور 4 کروڑ سے زیادہ ویب پیج جن کو Reddit پر Upvote کیا گیا تھا استعمال ہوئے۔ 

پھر GPT-3 جو جون 2020 میں آیا ایک بہت بڑی چھلانگ تھی جس میں ڈیٹا سیٹ 570 جی بی پر چلا گیا اور 175 ارب پیرامیٹرز (یہ اصل میں نیورل نیٹورک کے نوڈ ہیں) استعمال ہوئے۔ ورژن 3 بھی اپنی مثال آپ تھا اور انسان اور مشینوں کے درمیان فرق کرنے والی لکیر کو مٹانے کے قریب پہنچا۔ اس میں پہلے دونوں ورژن کا ڈیٹا اور انگریزی ویکیپیڈیا کا ڈیٹا بھی شامل ہوا۔ اس ورژن کا ڈیٹا سورس Common Crawl تھا  (60 فی صد) یہ ایک آرگنائزیشن ہے جو انٹرنیٹ پر موجود ڈیٹا کو فلٹر کرکے اپنے پاس محفوظ کرتی ہے مطلب ایک بہت بڑا ڈیٹا بیس بنایا جاتا ہے۔ ورژن 3 پر بھی کافی تبدیلیاں کی گئی جس میں جوابات کو کنٹرول کرنے کے لیے اور کسی بھی قسم کے غیر ضروری اور نقصان دہ ڈیٹا کو بند کرنے کے لیے سکریننگ کی گئی۔ جس کو تکنیکی طور پر Toxic language کہا جاتا ہے۔ پچھلے سال مارچ میں ورژن 3.5 آیا جو ابھی موجودہ ورژن ہے ChatGPT کے لینگویج ماڈل کا۔


--یہ ChatGPT اتنی معلومات کہا سے لاتا ہے؟

--اب یہ ChatGPT اصل میں GPT لینگویج ماڈل استعمال کرتا ہے جس کا 3.5 ورژن موجودہ ہے اور 4 ورژن آنے والا ہے۔ یہ لینگویج ماڈل کیسے ٹرین ہوتے ہیں ان کا ڈیٹا کا مآخذ کیا ہے اس کی تفصیل اوپر بیان کر دی گئی ہے۔


--اب GPT4 میں نیا کیا ہے؟ 

--اب بات کرتے ہیں GPT4 کی جس کے آنے سے پہلے وہی کام ہو رہا ہے جو ورژن 2 اور ورژن 3 کے آنے سے پہلے ہوا تھا یعنی قیاس آرائیاں اور مرچ مصالحہ۔ OpenAI کمپنی کے Founder and CEO نے بھی ورژن 4 کے متعلق سوشل میڈیا پر موجود تمام افواہوں کی تردید کرتے ہوئے کہا ہے کہ لوگوں نے اس سے بہت زیادہ امیدیں وابستہ کر لی ہیں اور ان کو اس کے ریلیز ہونے پر مایوسی ہوگی۔ ورژن 4 منگل کو ریلیز کر دیا گیا ہے جس میں وہ سب افواہیں دم توڑ رہی ہیں جو اس کے آنے سے پہلے گردش کر رہی تھیں۔ ابھی عام آدمی کے لیے کوئی فرق نہیں ہے صرف سافٹوئیر ڈیولپر کے لیے تصویر سے تحریر سرچ کا آپشن ہے، ویڈیو کا موجود نہیں ہے۔ سرچ کرنے کے لیے تحریر کی لمبائی 4 گنا سے 16 گنا بڑھا دی گئی ہے جس سے اس chatbot کو زیادہ Context ملے گا اور اس کو ہماری بات زیادہ سمجھ آئے گی اور جواب مزید درست ہوں گے۔ مائیکروسافٹ یہ ورژن اپنے Bing Search کے ساتھ جوڑ چکا ہے۔ اس ورژن میں کہیں بھی 100 ٹرلین پیرامیٹرز کا ذکر نہیں ہے، کہیں بھی ویڈیو جیریشن کا ذکر نہیں ہے۔ یہ ورژن یقینی طور پر ایک بہت بڑی چھلانگ ہے لیکن اس کی بھی Limitations ہیں۔ سب سے بڑا مسئلہ جانب دارانہ جواب اور غیر تصدیق شدہ تحریروں سے مواد حاصل کرنا ہے۔


--گوگل اور میٹا کا GPT4 سے موازنہ:

--مائکروسافٹ کے OpenAI کا ChatGPT خاص طور پر ورژن 4 کا موازنہ اگر گوگل کے Imagen Video سے کریں تو گوگل اس پر کام کر رہا ہے جس میں تحریر سے ویڈیو بنانے کی ٹیکنالوجی کافی اچھے نتائج دے رہی ہے اور آپ گوگل کی Imagen Video کی ویب سائٹ پر نمونے کے طور پر بنائی گئی تمام ویڈیوز دیکھ سکتے ہیں اور GPT 4 سے حاصل ہونے والی AI videos کوئی زیادہ مختلف نا ہوں گی۔ اس کے علاوہ گوگل نے حال ہئ میں اپنے ایک Large Language Model کی API ریلیز کی ہے PaLM-E کے نام سے جو اس GPT4 کے مقابلے کی جس کو استعمال کرکے تمام بزنس اپنے چیٹ بوٹ بنا سکتے ہیں۔

 ایسے ہی فیس بک کی کمپنی Meta بھی اسی Multimodal سسٹم پر کام کررہی ہے جس میں تحریر سے ویڈیو اور تصاویر سے ویڈیو بنانے کا فیچر موجود ہوگا۔ آپ ان کی ویب سائٹ پر بھی چیک کر سکتے ہیں۔


GPT4 

کی بات کریں تو کمپنی کی آفیشل ریلیز میں یہ بتایا گیا ہے کہ ابھی صرف text to text and image to text feature ہی مہیا کیا جائے گا اور تصویر سے تحریر یعنی تصویر کی پہچان کرکے اس کے بارے میں معلومات فراہم کر نے کا فیچر صرف سافٹ ویئر ڈیویلپرز کے لیے (API) ہے۔ تحریر سے تصویر والا کام تو اور بھی بہت سارے Artificial Intelligent سسٹم کر رہے ہیں جیسے DALL-E2 اور MidJourney وغیرہ۔  تحریر سے ویڈیو کا کہیں ذکر بھی نہیں ہے۔


کمپنی نے اپنے اس ورژن 4 میں بہت ساری کمیوں کا بھی اعتراف کیا ہے جس میں Buggy Programming code، یا غلط طبی مشورہ, معلومات کا درست نا ہونا شامل ہے۔ ابھی ورژن 4 کو ٹیسٹ کیا جا رہا ہے جس میں ہزاروں غلطیوں کا ازالہ کیا جائے گا لیکن خدارا اس کو ایسا بنا کر پیش نا کریں کہ اس کو انسانی عقل سے بھی آگے بڑھا دیا جائے۔ ابھی تک کوئی بھی مصنوعی ذہانت کا سسٹم ایسا نہیں ہے جو انسانی عقل کو مات دے سکے۔

یہ ChatGPT کہاں کہاں استعمال ہوسکتا ہے اس کے بارے میں تو آپ متعدد تحریریں پڑھ چکے ہوں گے لیکن اس بارے میں بھی ایک تحریر لکھوں گا کہ اس کا بہترین استعمال کہاں کہاں کر سکتے ہیں خاص طور پر طالب علم، ریسرچرز ، بلاگرز، اور پروگرامنگ کرنے والے لوگ۔


--اس کے استعمال کی احتیاطی تدابیر:

اس کے جواب 100 فی صد درست نہیں ہوں گے کیونکہ اس میں اپنی ذہانت نہیں ہے یہ اس ڈیٹا پر کام کرتا ہے جو پہلے سے موجود ہے جیسے ویکیپیڈیا، آنلائن کتابیں، آرٹیکل یا ڈسکشن فورم۔ 

طبی یا تکنیکی معاملات میں اس پر بھروسہ نہیں کیا جاسکتا اس کے لیے آپ کو ماہرین سے رابطہ کرنا ہوگا۔ 

ریسرچ کرنے والے طلباء یا کوئی بھی اس کی بتائی گئی تحریر کو عین ہو بہو نقل نہیں کرسکتا کیونکہ یہ خود سے کوئی تحقیق نہیں کرتا بلکہ پہلے سے موجود غلط یا درست ڈیٹا پر کام کرتا ہے۔


Comments

Popular posts from this blog

11th Class Computer ONLINE Test/Paper

9th COMPUTER New Syllabus Notes