هوش مصنوعی در مورد جهان چه چیزی می تواند بیاموزد؟


هوش مصنوعی و یادگیری ماشین با کاربردهایی از تجزیه و تحلیل داده ها، امنیت سایبری، توسعه دارویی، آهنگسازی و اجرای هنری در همه جا فراگیر شده اند. مدل‌های زبان بزرگ (LLM) نیز در سال‌های اخیر ظهور کرده‌اند و تعامل انسانی و تایپ کردن را به فهرست طولانی برنامه‌ها اضافه کرده‌اند. این شامل ChatGPT، یک LLM است که از زمان معرفی آن کمتر از دو سال پیش تأثیر عمیقی داشته است. این نرم افزار بحث (و بحث) قابل توجهی را در مورد کاربردهای بالقوه و پیامدهای هوش مصنوعی برانگیخته است.

نجوم همچنین مزایای زیادی دارد، جایی که یادگیری ماشینی برای مرتب‌سازی حجم عظیمی از داده‌ها برای جستجوی نشانه‌های گذر سیاره‌ای، تصحیح اختلالات جوی و یافتن الگوهای نویز استفاده می‌شود. به گفته یک تیم بین‌المللی از اخترفیزیکدانان، این می‌تواند تنها آغاز کاری باشد که هوش مصنوعی می‌تواند برای نجوم انجام دهد. که در مطالعه اخیر، این تیم یک مدل ترانسفورماتور از پیش آموزش دیده (GPT) را با استفاده از مشاهدات اجرام نجومی اصلاح کردند. در این فرآیند، آنها با موفقیت نشان داده‌اند که مدل‌های GPT می‌توانند به طور موثر به تحقیقات علمی کمک کنند.

مطالعه توسط مرکز بین المللی شبکه اخترفیزیک نسبیتی (ICRANet)، یک کنسرسیوم بین المللی متشکل از محققان از مرکز بین المللی اخترفیزیک نسبیتی (ICRA)، در موسسه ملی اخترفیزیک (INAF)، دانشگاه علم و صنعت چین، موسسه فیزیک انرژی بالا، آکادمی علوم چین (CAS-IHEP)، دانشگاه پادوآ، دانشگاه صنعتی اصفهان و دانشگاه فریرا. پیش چاپ مقاله آنها،تست تنظیم دقیق GPT با استفاده از داده های اخترفیزیکی“، اخیراً در فضای مجازی ظاهر شد.

تصویر یک اختروش فعال. تحقیقات جدید نشان می دهد که هوش مصنوعی می تواند آنها را شناسایی و طبقه بندی کند. اعتبار: ESO/M. کورنمسر

همانطور که گفته شد، اخترشناسان برای مرتب‌سازی حجم داده‌های به‌دست‌آمده توسط تلسکوپ‌ها و ابزار مدرن، به شدت به الگوریتم‌های یادگیری ماشینی تکیه می‌کنند. این عمل حدود یک دهه پیش آغاز شد و از آن زمان با جهش و مرزهای گسترده ای رشد کرد تا جایی که هوش مصنوعی در کل فرآیند تحقیق ادغام شد. همانطور که یو وانگ رئیس ICRA و نویسنده اصلی مطالعه از طریق ایمیل به Universe Today گفت:

نجوم همیشه مبتنی بر داده بوده است و ستاره شناسان از اولین دانشمندانی بودند که یادگیری ماشین را پذیرفتند و از آن استفاده کردند. یادگیری ماشین اکنون در کل فرآیند تحقیقات نجومی، از تولید و کنترل تلسکوپ‌های زمینی و فضایی (مانند بهینه‌سازی عملکرد سیستم‌های نوری تطبیقی، بهبود شروع اقدامات خاص (محرک‌ها) ماهواره‌ها تحت شرایط خاص، ادغام شده است. و غیره)، برای تجزیه و تحلیل داده ها (مانند حذف نویز، انتساب داده ها، طبقه بندی، شبیه سازی و غیره) و ایجاد و اعتبارسنجی مدل های نظری (مانند آزمایش گرانش اصلاح شده، محدود کردن معادله حالت برای ستاره های نوترونی و غیره).

تجزیه و تحلیل داده رایج ترین این برنامه ها باقی می ماند، زیرا ساده ترین حوزه ای است که یادگیری ماشین را می توان در آن ادغام کرد. به طور سنتی، ده ها محقق و صدها شهروند دانشمند حجم داده های تولید شده توسط یک کمپین نظارتی را تجزیه و تحلیل می کنند. با این حال، در عصری که تلسکوپ های مدرن هر روز ترابایت داده جمع آوری می کنند، این عملی نیست. این شامل بررسی های سراسر آسمان مانند بررسی آسمان آرایه بسیار بزرگ (VLASS) و بسیاری از مراحل انجام شده توسط بررسی آسمان دیجیتال اسلون (SDSS).

تا به امروز، LLM ها تنها به صورت پراکنده در تحقیقات نجومی به کار گرفته شده اند، با توجه به اینکه آنها یک ساخته نسبتاً جدید هستند. اما به گفته طرفدارانی مانند وانگ، تأثیر زیادی بر جامعه داشته است و پتانسیل یک کران پایینی معادل «انقلاب صنعتی» را دارد. در مورد حد بالایی، وانگ پیش‌بینی می‌کند که می‌تواند بسیار متفاوت باشد و شاید به “روشنگری یا نابودی” بشریت منجر شود. با این حال، برخلاف انقلاب صنعتی، سرعت تغییر و ادغام برای هوش مصنوعی بسیار سریع‌تر است و این پرسش‌ها را در مورد اینکه پذیرش آن تا کجا پیش خواهد رفت، ایجاد می‌کند.

تلسکوپ بررسی آسمان دیجیتال اسلون در مقابل پس زمینه خیره کننده کوه های ساکرامنتو برجسته است.  234 ستاره در فهرست اسلون با بیش از 2.5 میلیون ستاره، سیگنال پالسی غیرقابل توضیحی تولید می کنند.  تصویر: SDSS، Fermilab Visual Media Services
تلسکوپ بررسی آسمان دیجیتال اسلون در مقابل پس‌زمینه خیره‌کننده کوه‌های ساکرامنتو خودنمایی می‌کند. اعتبار: SDSS/Fermilab Visual Media Services

وانگ گفت که برای تعیین پتانسیل آن برای رشته نجوم، او و همکارانش یک مدل GPT از پیش آموزش دیده را انتخاب کردند و آن را برای شناسایی پدیده های نجومی تنظیم کردند:

“OpenAI مدل های از پیش آموزش دیده را ارائه می دهد و کاری که ما انجام داده ایم تنظیم دقیقی است که شامل تغییر برخی پارامترها بر اساس مدل اصلی است و به آن امکان می دهد داده های نجومی را تشخیص دهد و نتایج را از آن داده ها محاسبه کند. به نوعی مانند OpenAI است که دانشجویی را به ما ارائه می دهد که پس از آن برای تبدیل شدن به یک دانشجوی فارغ التحصیل در رشته نجوم آموزش دادیم.

ما داده های محدودی با وضوح متوسط ​​ارائه کردیم و GPT را کمتر از مدل های معمولی آموزش دادیم. با این حال، نتایج چشمگیر هستند و به دقت حدود 90٪ دست می یابند. این سطح بالای دقت به دلیل پایه قوی GPT است که از قبل پردازش داده ها را درک کرده و دارای قابلیت های استدلال و همچنین مهارت های ارتباطی است.

این تیم برای تنظیم دقیق مدل خود، مشاهداتی از پدیده های نجومی مختلف که از کاتالوگ های مختلف گرفته شده بودند را وارد کردند. این شامل 2000 نمونه اختروش، کهکشان، ستاره و اختروش خط جذب گسترده (BAL) از SDSS (هر کدام 500) است. آنها همچنین مشاهدات انفجارهای کوتاه و بلند پرتو گاما (GRBs)، کهکشان ها، ستارگان و شبیه سازی سیاهچاله ها را ادغام کردند. هنگامی که آزمایش شد، مدل آنها با موفقیت پدیده های مختلف را طبقه بندی کرد، انواع اختروش ها را متمایز کرد، فاصله آنها را بر اساس انتقال به سرخ استنباط کرد، و چرخش و تمایل سیاهچاله ها را اندازه گرفت.

وانگ گفت: “این کار حداقل نشان می دهد که LLM ها قادر به پردازش داده های نجومی هستند.” علاوه بر این، توانایی یک مدل برای مدیریت انواع مختلف داده‌های نجومی، قابلیتی است که سایر مدل‌های تخصصی از آن برخوردار نیستند. ما امیدواریم که LLM ها بتوانند انواع مختلف داده ها را ادغام کنند و سپس اصول اساسی مشترک را شناسایی کنند تا به ما در درک جهان کمک کنند. البته، این یک کار چالش برانگیز است و اخترشناسان به تنهایی نمی توانند آن را انجام دهند.

رصدخانه ورا روبین در غروب در آوریل 2021. انتظار طولانی بود، اما رصدخانه باید اولین نور را اواخر امسال ببیند. اعتبار: Rubin Obs/NSF/AURA

البته، تیم اعتراف می کند که مجموعه داده ای که آنها با آن آزمایش کردند در مقایسه با داده های خام رصدخانه های مدرن بسیار ناچیز است. این امر به ویژه برای تجهیزات نسل بعدی مانند رصدخانه Vera C. Rubinکه اخیراً دوربین LSST خود را دریافت کرده است، بزرگترین دوربین دیجیتال جهان! وقتی روبین راه اندازی شد، دوره ده ساله را اجرا خواهد کرد کاوش ارثی فضا و زمان (LSST) که انتظار می رود هر شب 15 ترابایت داده تولید کند! وانگ می‌گوید برآورده کردن خواسته‌های کمپین‌های آتی نیازمند بهبود و همکاری بین رصدخانه‌ها و شرکت‌های حرفه‌ای هوش مصنوعی است.

با این حال، این یک نتیجه گیری قبلی است که در آینده نزدیک برنامه های کاربردی LLM بیشتری برای نجوم وجود خواهد داشت. این نه تنها یک پیشرفت محتمل است، بلکه با توجه به حجم وسیعی از داده‌هایی که امروزه تحقیقات نجومی تولید می‌کنند، ضروری است. و از آنجایی که احتمالاً در آینده نزدیک این میزان به طور تصاعدی افزایش خواهد یافت، هوش مصنوعی احتمالاً در زمینه تحقیقات ضروری است.

اطلاعات بیشتر: arXiv



Source link

پیمایش به بالا