تین نئے یو ایس ای کثیر لسانی ماڈیول ٹینسرفلو پر آرہے ہیں

ٹیک / تین نئے یو ایس ای کثیر لسانی ماڈیول ٹینسرفلو پر آرہے ہیں 2 منٹ پڑھا

گوگل وائس سرچ



گوگل AI تحقیق کے علمبرداروں میں سے ایک ہے اور ان کے بہت سارے پروجیکٹس کا رخ سر کرنا پڑتا ہے۔ الفا زیرو گوگل کی طرف سے ڈیپ مائنڈ اس پروگرام کی خود بخود (بغیر کسی انسانی تربیت اور مداخلت کے) پیچیدہ کھیل سیکھنے کی صلاحیت کی وجہ سے ٹیم ، AI کی تحقیق میں ایک پیش رفت تھی۔ گوگل نے بھی اس میں عمدہ کام کیا ہے قدرتی زبان پر کارروائی کے پروگرام (NLPs) ، جو انسانی تقریر کو سمجھنے اور اس پر کارروائی کرنے میں گوگل اسسٹنٹ کی کارکردگی کے پیچھے ایک وجہ ہے۔

گوگل نے حال ہی میں تین نئے کی رہائی کا اعلان کیا ہے کثیر لسانی ماڈیول استعمال کریں اور اسی طرح کے متنی متن کی بازیافت کے ل more زیادہ کثیر لسانی ماڈل فراہم کرتے ہیں۔



پہلے دو ماڈیولز اسی طرح کے متن کو بازیافت کرنے کے لئے کثیر لسانی ماڈلز کی فراہمی کرتے ہیں ، جن میں سے ایک بازیافت کی کارکردگی کے لئے بہتر ہے اور دوسرا رفتار اور کم میموری استعمال کے ل.۔ تیسرا ماڈل کے لئے مہارت حاصل ہے سوال جواب کی بازیافت سولہ زبانوں میں (USE-QA) اور USE کی مکمل طور پر نئی اطلاق کی نمائندگی کرتا ہے۔ تینوں کثیر لسانی ماڈیول ایک کے استعمال سے تربیت یافتہ ہیں ملٹی ٹاسک ڈبل انکوڈر فریم ورک ، انگریزی کے اصلی یو ایس ای ماڈل کی طرح ، جبکہ تکنیکوں کا استعمال کرتے ہوئے ہم نے اسے بہتر بنانے کے ل developed تیار کیا اضافی مارجن سافٹ مینکس نقطہ نظر کے ساتھ ڈبل انکوڈر . وہ نہ صرف ٹرانسفر سیکھنے کی عمدہ کارکردگی کو برقرار رکھنے کے لئے تیار کیے گئے ہیں بلکہ اچھی طرح سے نحوی اعداد و شمار کی بازیابی کے کاموں کو انجام دینے کے لئے بھی تیار کیے گئے ہیں۔



سسٹم میں لینگویج پروسیسنگ کا ایک لمبا فاصلہ طے ہوا ہے ، بنیادی نحو کے درخت کو پارس کرنے سے لے کر بڑے ویکٹر ایسوسی ایشن کے ماڈلز تک۔ متن میں سیاق و سباق کو سمجھنا NLP فیلڈ کا سب سے بڑا مسئلہ ہے اور یونیورسل سینیٹٹی انکوڈر نے اس کو اعلی جہتی ویکٹر میں متن میں تبدیل کرکے حل کیا ، جس سے متن کی درجہ بندی اور تشریح آسان ہوجاتا ہے۔



یو ٹی ای نشان زد کرنے والے ڈھانچے کا ماخذ - گوگل بلاگ

گوگل کے مطابق ، “ تینوں نئے ماڈیولز سیمنٹک بازیافت فن تعمیر پر بنائے گئے ہیں ، جو عام طور پر سوالات اور جوابات کے انکوڈنگ کو الگ الگ عصبی نیٹ ورکس میں تقسیم کرتے ہیں ، جس کی وجہ سے اربوں ممکنہ جوابات کو سیکنڈ سیکنڈ کے اندر تلاش کرنا ممکن ہوتا ہے۔ ”دوسرے الفاظ میں ، اس سے اعداد و شمار کی بہتر ترتیب دینے میں مدد ملتی ہے۔

' تینوں کثیر لسانی ماڈیول ایک کے استعمال سے تربیت یافتہ ہیں ملٹی ٹاسک ڈبل انکوڈر فریم ورک ، انگریزی کے اصلی یو ایس ای ماڈل کی طرح ، جبکہ تکنیکوں کا استعمال کرتے ہوئے ہم نے اسے بہتر بنانے کے ل developed تیار کیا اضافی مارجن سافٹ مینکس نقطہ نظر کے ساتھ ڈبل انکوڈر . وہ نہ صرف ٹرانسفر سیکھنے کی عمدہ کارکردگی کو برقرار رکھنے کے لئے تیار کیے گئے ہیں بلکہ اچھی طرح سے نحوی اعداد و شمار کی بازیابی کے کاموں کو انجام دینے کے لئے بھی تیار کیے گئے ہیں ' سوفٹ میکس فنکشن اکثر ویکٹروں کو معاف کر کے اور پھر ہر عنصر کو کفایت کرنے والے کے حساب سے تقسیم کرکے کمپیوٹیشنل پاور کو بچانے کے لئے استعمال کیا جاتا ہے۔



Semantic بازیافت فن تعمیر

انہوں نے کہا کہ تینوں نئے ماڈیولز سیمنٹک بازیافت فن تعمیرات پر بنائے گئے ہیں ، جو عام طور پر سوالات اور جوابات کے انکوڈنگ کو الگ الگ عصبی نیٹ ورک میں تقسیم کرتے ہیں ، جس کی وجہ سے اربوں ممکنہ جوابات کو سیکنڈ سیکنڈ میں تلاش کرنا ممکن ہوجاتا ہے۔ موثر سیمانی بازیافت کے ل se ڈوئل انکوڈرز کے استعمال کی کلید یہ ہے کہ امیدوار کے ان پٹ سوالات کے تمام امیدواروں کے جوابات کو پہلے سے انکوڈ کریں اور ان کو ویکٹر ڈیٹا بیس میں محفوظ کریں جو حل کرنے کے ل for بہتر ہے قریب ترین پڑوسی مسئلہ ، جو امیدواروں کی ایک بڑی تعداد کو اچھ withی کے ساتھ جلدی سے تلاش کرنے کی اجازت دیتا ہے صحت سے متعلق اور یاد '

آپ ان ماڈیولز کو ٹینسرفلو مرکز سے ڈاؤن لوڈ کرسکتے ہیں۔ مزید پڑھنے کے ل Google گوگل ای اے کے فل سے رجوع کریں بلاگ پوسٹ .

ٹیگز گوگل