از كار در آمازون تا گوگل ریسرچ؛

برنده ایرانی جایزه مصطفی(ص) کیست مخترع روش جادویی دسته بندی سریع داده

به گزارش ایت بال، وهاب میررکنی، دانش آموخته دانشگاه صنعتی شریف و MIT، جایزه معتبر مصطفی (ص) را برای توسعه الگوریتمی نوین در شناسایی شباهت داده ها و دسته بندی سریع داده ها از آن خود کرد.

به گزارش ایت بال به نقل از مهر، جایزه مصطفی (ص) یکی از معتبرترین جوایز علمی و فناوری در جهان اسلام است که هر دو سال یک دفعه به محققان برجسته ای اهدا می شود که در حوزه های مختلف علمی و فناوری، دستاوردهای نوآورانه و تأثیرگذاری داشته اند. این جایزه به اثری نوآورانه در مرزهای دانش تعلق می گیرد که توسط اشخاصی شاخص در حوزه های علم و فناوری عرضه شده و زمینه ساز بهبود زندگی بشریت باشد.
در سال ۲۰۲۵، سه پژوهشگر برجسته از سه کشور مختلف در ششمین دوره جایزه مصطفی عرضه شدند که یکی از آن مهمت تونر، متولد ۱۹۵۸ در استانبول ترکیه است و توانست با توسعه فناوری میکروفیلویدیک در جداسازی سلول های تومور برای تشخیص فوری بیماریها در فهرست برگزیدگان قرار بگیرد. نفر دوم وهاب میررکنی پژوهشگر ایرانی است. میررکنی متولد ۱۹۷۹ بوده و با فعالیتهای برجسته در حوزه الگوریتم های هوش مصنوعی برگزیده ششمین دوره جایزه مصطفی شده است. سومین نفر نیز محمد خواجه نذیرالدین، متولد ۱۹۵۷ در هند است که با فناوری سلول های خورشیدی حساس به رنگ و پروسکایت که نقشی مهم در توسعه انرژی پاک دارد، در فهرست برگزیدگان این دوره قرار گرفته است.

زندگینامه وهاب میررکنی پژوهشگر ایرانی برگزیده جایزه مصطفی

سفر و جست وجوی ذهن هر پژوهشگر، شبکه ای از سؤال ها، تجربه ها و آزمون هاست که مسیر علم را شکل می دهد. وهاب میررکنی این مسیر را از دفترچه ای پر از مسایل در دوران کودکی شروع کرد و سپس از کلاس های مدرسه و مسابقات روباتیک به دانشگاه های معتبر جهان و لابراتوار های تحقیقاتی بزرگ رسید. تجربه های مختلف او نشان میدهد که پیشرفت علمی نه یک مسیر خطی، بلکه شبکه ای از کشف ها، آزمون ها و تجارب متنوع است که همواره در تعامل با مسایل واقعی زندگی شکل می گیرد.
مسیر علمی او از کلاس های مدرسه تا دانشگاه و تحقیقات صنعتی، همواره با کشف و چالش همراه بوده است. وی در کلاس های دبیرستان استعدادهای درخشان کرج ساعت ها با دشوارترین پرسش ها دست و پنجه نرم می کرد. مسابقات المپیاد و رقابتهای جهانی RoboCup، اولین میدان های رشد او بودند؛ جایی که آموخت اعتماد به نفس و کار تیمی، زیربنای هر موفقیت بزرگ است. هنوز هم روزی را به یاد دارد که گروهشان در اروپا مقام اول را کسب نمود. برای او، ارزشمندتر از مدال ها، تجربه عمیق همکاری و خودباوری بود.

از دانشگاه صنعتی شریف تا دانشگاه MIT

ورود به دانشگاه مسیر او را از آموزش های معمولی جدا کرد و به دانشگاه صنعتی شریف راه یافت؛ جایی که پروژه ها، مسابقات برنامه نویسی و روباتیک، عشقش به الگوریتم ها را عمق بیشتری بخشید.
این تجربیات، او را با راهکارهای خلاقانه برای مسایل پیچیده آشنا کرد. این عادت بعدها در پژوهش هایش به الگویی ثابت تبدیل شد: خرد کردن مسایل به بخش های کوچک، تحلیل دقیق و بازسازی آنها در ابعادی نو. در همین دانشگاه بود که فهمید باید آینده اش را در علوم نظری کامپیوتر بسازد؛ انتخابی که او را در سال ۲۰۰۵، به دانشگاه MIT در بوستون رساند. در بین ذهن های درخشان، غرق در دنیای علوم نظری کامپیوتر شد؛ محیطی که نه تنها به او آموخت چطور عمیق تر بیندیشد، بلکه به او یاد داد علم زمانی باارزش است که با زندگی واقعی پیوند بخورد.

فعالیت در پروژه های بزرگ داده در گوگل ریسرچ

پس از فارغ التحصیلی از MIT، کار در آمازون و مایکروسافت ریسرچ برای میررکنی بعنوان یک لابراتوار زنده عمل کرد؛ جایی که باید الگوریتم های نظری را به راهکار هایی تبدیل می کرد که میلیون ها کاربر روزانه با آنها سروکار دارند؛ اما مقصد اصلی اش گوگل ریسرچ بود؛ جایی که بالاتر از یک دهه در پروژه های بزرگ و در مقیاس های عظیم فعال است. در اینجا با داده هایی کار می کند که گاهی به اندازه کل جمعیت زمین به هم مرتبط هستند. این تجربه مدام به او یادآوری می کند که علم زمانی معنا دارد که بتواند از دل تئوری، چاره ای برای حقیقت بیرون بکشد. او حالا ریاست گروههای تحقیقاتی الگوریتم ها در نیویورک را نیز بر عهده دارد.

دامنه گسترده پروژه ها؛ از الگوریتم های بازار تا هوش مصنوعی نسل جدید

پروژه های وی از الگوریتم های بازار و بهینه سازی در مقیاس بزرگ تا گراف کاوی و پروژه های نسل جدید AI مانند Gemini AI گسترده است. دنیای هوش مصنوعی برای او همواره یک ماجراجویی تازه است. هر ماه مدلها و روش های جدیدی معرفی می گردند که مرزهای تخیل روز گذشته را پشت سر می گذارند. آن چه بالاتر از همه او را شگفت زده می کند، توانایی سیستم ها برای یادگیری و بهبود خودشان است؛ پدیده ای که سرعت پیشرفت را از هر نمودار خطی فراتر برده است. آینده ای که پیش تر با سال ها فاصله قابل پیشبینی بود، امروز در عرض چند ماه دگرگون می شود. او این عدم قطعیت را نه تهدید، بلکه فرصتی ناب می بیند؛ فرصتی برای خلق ابزارها و ایده هایی که زندگی انسان را به گونه ای عمیق تر با علم گره می زنند.
میررکنی همواره بر این نکته تاکید دارد که هیچ موفقیتی واقعی نیست مگر آنکه با دیگران به اشتراک گذاشته شود. او اعتقاد دارد که دستاوردها نه تنها حاصل تلاش فردی، بلکه نتیجه همکاری، اعتماد و همفکری گروههای پژوهشی است. این فلسفه در راه علمی او نمود یافته و جایزه مصطفی (ص) در سال ۲۰۲۵ به پاس دستاوردش در طرح هشینگ حساس به محل برمبنای توزیع های p-پایدار، نمونه ای برجسته از این دیدگاه است. از دیگر جوایز دریافتی او می توان به بهترین مقاله کنفرانس ACM در تجارت الکترونیک در سال ۲۰۰۸، بهترین مقاله دانشجویی سمپوزیوم ACM-SIAM در سال ۲۰۰۵ و مدال طلای المپیاد انفورماتیک ایران در سال ۱۹۹۶ اشاره نمود. خانواده، دوستان، همکاران و تیم های تحقیقاتی همگی نقش بسزایی در هر موفقیت این پژوهشگر داشته اند و این دستاوردها نتیجه اعتماد و همکاری جمعی است. به این علت او نیز خیلی از الگوریتم ها و کتابخانه های در رابطه با شبکه های عصبی گراف و داده کاوی را بصورت متن باز منتشر نموده است تا دیگران نیز بتوانند از آن بهره گیرند و مسیر پیشرفت علمی ادامه یابد. برای او، علم همیشه محصول تلاش جمعی است و هیچ دستاوردی بدون همراهی دیگران کامل نمی گردد.
زندگی میررکنی تنها در معادلات و الگوریتم ها خلاصه نمی گردد. از دوران نوجوانی که فوتبال و پینگ پنگ بازی می کرد و لذت همکاری و رقابت دوستانه را می آموخت، تا امروز که شادی های کوچک بازی با فرزندانش را قدر می داند، همواره تعادل میان علم، خانواده و جامعه را کلید رشد واقعی می داند. تجربه گذراندن وقت با بچه ها و یادگیری متقابل با آنها، یکی از ارزشمندترین لحظات زندگی اش است و حسی از رضایت و شادی به او می دهد که هیچ موفقیت علمی نمی تواند جای آنرا بگیرد.

توصیه میررکنی به نسل جوان: همه کارها را به هوش مصنوعی نسپارید

در کنار فعالیت هایش در گوگل ریسرچ، میررکنی بعنوان استاد مدعو در دانشگاه نیویورک در مؤسسه کورانت، الگوریتم ها و اقتصاد اینترنت را تدریس می کند و به نسل جوان گوشزد می کند: «اکنون بهترین زمان برای ورود به عرصه پژوهش است. سرعت پیشرفت ها در هوش مصنوعی فرصتی منحصربه فرد به وجود آورده تا رویاهایتان سریع تر از همیشه به حقیقت تبدیل شوند؛ اما فراموش نکنید، اگر همه کارها را به هوش مصنوعی بسپارید، مغزتان فرصت رشد و تکامل را از دست خواهد داد.» او آینده ای را می بیند که در آن انسان و هوش مصنوعی در کنار هم مسایل پیچیده ریاضی را حل می کنند و الگوریتم ها زندگی روزمره را در حوزه هایی مانند پزشکی، علوم اجتماعی و فراتر از آن بهبود می بخشند.

آشنایی با اثر میررکنی برگزیده جایزه ۲۰۲۵ مصطفی (ص)

شاید در نگاه اول، شباهت مفهومی ساده به نظر برسد؛ اما زمانی که وارد دنیای داده ها می شویم، همین مفهوم ساده، شکلی دقیق تر و متفاوت تر به خود می گیرد. برای کامپیوترها، همه چیز صرفا دنباله ای از عددهاست. یک عکس بشکل فهرستی از عددهایی است که پیکسل ها را نشان می دهند یا حتی یک صدای ضبط شده، نوسانات فرکانس در چارچوب ارقامی پشت هم هستند. وقتی پا در جهانی می گذاریم که همه چیز عدد است، شباهت هم باید بر اساس این عددها تعریف شود. در چنین فضایی، اگر بخواهیم بدانیم دو چیز چقدر به هم شبیه اند، باید بفهمیم که چقدر از هم فاصله دارند. چون در منطق ماشین، هرچه فاصله بین دو مجموعه کم تر باشد، تفاوت آنها نیز کم تر می شود. به این علت است که مفهوم فاصله به ابزار اصلی ما برای سنجش شباهت تبدیل می شود. البته اندازه گیری این فاصله، خود مساله ای مهم می باشد، برای اینکه راه های مختلفی برای محاسبه آن وجود دارد.
برای اندازه گیری این نزدیکی از روشی موسوم به LPnorm استفاده می شود. این تکنیک یک فرمول کلی دارد که با تغییر عددی به نام P، زاویه دید ما به مفهوم فاصله تغییر می کند. مثلا فرض کنید روی کاغذ دو نقطه رسم کرده اید و می خواهید فاصله شان را اندازه بگیرید. اگر خط کش را طوری بگذارید که خطی صاف و مستقیم میان آنها رسم شود، درحقیقت کوتاه ترین مسیر ممکن را اندازه گرفته اید. این همان حالتی است که p برابر ۲ دیده می شود و در ریاضیات به آن فاصله اقلیدسی می گویند. حالا تصور کنید که برای رسیدن از یک نقطه به نقطه دیگر، فقط اجازه داشته باشید حرکت های عمودی و افقی انجام دهید. در این حالت فاصله بین دو نقطه، با جمع کردن مقدار حرکت در هر مسیر افقی و عمودی به دست می آید. این نوع محاسبه برای زمانی است که p برابر با ۱ است و به آن فاصله منهتنی گفته می شود. اصولا عدد p مشخص می کند که سیستم به چه نوع تفاوتی بین داده ها بیشتر توجه کند.
حالا این مفهوم فاصله را به جهان دیجیتال وارد می نماییم، جایی که داده ها دیگر تصویر و صدا و جمله نیستند، بلکه بردارهایی از اعداد شده اند. همانطور که قبل تر ذکر شد، در کامپیوتر نیز برای سنجش شباهت بین دو تصویر یا متن، فاصله میان بردارها اندازه گیری می شود. مثلا وقتی یک موتور جست وجو باید تشخیص دهد که دو عبارت به یک مبحث اشاره دارند، یا وقتی برنامه ای موسیقی محور، آهنگ های مشابه را پیشنهاد می دهد، آن چه پشت صحنه اتفاق می افتد همین مقایسه بردارهاست. در این راه، بسته به این که هدف الگوریتم دقت بالا باشد یا سرعت بیشتر، می توان از مقادیر مختلف p استفاده کرد. درصورتی که بخواهیم به تفاوت های جزئی و دقیق دقت کنیم، مقدار 1p= انتخاب خوبی است، چون همه ی اختلاف ها با وزن مساوی وارد محاسبه می شوند؛ اما اگر بخواهیم یک دید کلی تر داشته باشیم، مقدار 2p= مناسب تر است. این مقدار به کامپیوتر اجازه می دهد با سرعت بیشتری، فاصله میان بردارها را تخمین بزند. نکته مهم این است که برای تمام مقادیر p≥1، فاصله LP یک متریک معتبر است و خصوصیت های ریاضیاتی مانند قانون مثلث را حفظ می نماید اما اگر p<1 درنظر گرفته شود، هرچند می توان همان فرمول را نوشت، نتیجه دیگر یک متریک واقعی نیست و قانون مثلث برقرار نمی ماند؛ به این علت چنین حالتی بیشتر در مباحث نظری یا کاربردهای خاص استفاده می شود.
در علوم داده و یادگیری ماشین، به صورت معمول با p≥1 کار می شود چون هم شهود آن ساده تر است و هم از نظر ریاضی خواص خوبی مانند قانون مثلث را دارد. با اینحال پژوهش های نوآورانه ای مانند پژوهش های وهاب میررکنی، امکان بهره برداری مؤثری از p<1 را فراهم نموده اند و حالا کامپیوتر ها، بهتر و سریع تر از همیشه می توانند تفاوت ها را ببینند. هرچقدر هم روش خوبی برای سنجش شباهت بین داده ها داشته باشیم، باز هم با یک چالش بزرگ روبه رو هستیم. سرزمین داده ها بی انتهاست. میلیونها تصویر، متن، صدا و ویدئو در کامپیوتر ذخیره شده اند و اگر بخواهیم برای پیداکردن یک فایل خاص، همه این موارد را تک تک با هم مقایسه نماییم، زمان بسیار زیادی لازم خواهد بود. اینجاست که الگوریتمی هوشمندانه، حاصل تلاشهای اشخاصی همچون میررکنی وارد ماجرا می شود. Locality-Sensitive Hashing یا به اختصار LSH، روشی برای دسته بندی سریع داده ها است.

LSH؛ روشی هوشمندانه برای دسته بندی سریع داده ها

در این الگوریتم، داده هایی که به هم شبیه اند، به سادگی در یک گروه قرار می گیرند؛ اما با وجود حجم بالای اطلاعات چگونه چنین چیزی ممکن است؟ LSH از ترفند جالبی استفاده می نماید. این تکنیک بجای مقایسه مستقیم بردارهای طولانی، آنها را با کمک الگوریتم های ریاضی خاصی به نام توابع هش مخصوص، به بردارهایی کوتاه و خلاصه شده ای مبدل می کند که هنوز اطلاعات مهم را حفظ می کنند. این مانند زمانی است که بجای خواندن تمام یک کتاب، چکیده ای هوشمند از آنرا دراختیار داشته باشیم که هنوز هم حال وهوای متن اصلی را منتقل می کند. LSH برای حفظ فاصله تقریبی بردارهای خلاصه شده، از ابزاری به نام توزیع Pپایدار استفاده می نماید.

خاصیت جادویی توزیع پایدار داده ها

این نوع توزیع، برداری تصادفی از عددها در اختیار ما قرار می دهد که با اعمال یک سری عملیات جبری با بردار اصلی، برداری خلاصه شده از داده ما حاصل شود. خاصیت جادویی این توزیع در این است که فاصله بین خروجی ها، تقریب خوبی از فاصله میان داده های اصلی می شود. یعنی ما می توانیم بدون دست زدن به کل اطلاعات، با برداری کوتاه از هر داده، بفهمیم کدام یک به هم نزدیک ترند.
نکته دیگر در این است که بسته به این که چه نوع فاصله ای اندازه گیری خواهد شد، از توزیع Pپایدار خاصی استفاده می شود. برای نمونه اگر فاصله اقلیدسی مدنظر باشد، باید بردارهای تصادفی مان را از توزیع Pپایداری به نام گاوسی انتخاب کنیم؛ چون این توزیع، برای محاسبه در زمان p=۲ است. برای مقادیر دیگر p، توزیع های مخصوص خودشان وجود دارند. به این ترتیب، می توان با سرعت بالا داده های شبیه را بدون احتیاج به جست وجو طاقت فرسا دسته بندی کرد.

LSH؛ دستیاری با تجربه برای خلاصه سازی هوشمند

در این تکنیک نو، دیگر نیازی نیست قالب داده ها را به کلی عوض نماییم یا آنها را در قالب های پیچیده جا بدهیم. همین سادگی عمل است که به سرعتی تعجب آور منجر گردیده است. LSH در بعضی آزمایش ها تا ۴۰ برابر از روش های سنتی مثل kd-tree سریع تر عمل کرده و حتی در وضعیت دشوارتر، مانند زمانی که p کمتر از ۱ است، جست و جو را ممکن کرده است. خلاصه سازی هوشمند، این تکنیک را به دستیاری باتجربه در راه شناخت تفاوت ها مبدل کرده است. در دنیای عددها و بردارها، شاید احساسی در کار نباشد اما می توان شباهت را با سرعتی چندبرابر تشخیص داد.
حرف آخر اینکه از دیگر جوایز دریافتی او میتوان به بهترین مقاله کنفرانس ACM در تجارت الکترونیک در سال ۲۰۰۸، بهترین مقاله دانشجویی سمپوزیوم ACM-SIAM در سال ۲۰۰۵ و مدال طلای المپیاد انفورماتیک ایران در سال ۱۹۹۶ اشاره نمود. این تکنیک یک فرمول کلی دارد که با تغییر عددی به نام P، زاویه دید ما به مفهوم فاصله تغییر می کند. همین سادگی عمل است که به سرعتی حیرت انگیز منجر گردیده است.

منبع: ایت بال

1404/06/17

11:03:14

5.0 / 5

293

تگهای خبر: آموزش , آهنگ , اینترنت , بازی

این مطلب را می پسندید؟

(1)

(0)

تازه ترین مطالب مرتبط

نظرات بینندگان در مورد این مطلب

لطفا شما هم در مورد این مطلب نظر دهید

= ۹ بعلاوه ۵

ارسال کامنت