هوش مصنوعی و یادگیری ماشین با کاربردهایی از تجزیه و تحلیل داده ها، امنیت سایبری، توسعه دارویی، آهنگسازی و اجرای هنری در همه جا فراگیر شده اند. مدلهای زبان بزرگ (LLM) نیز در سالهای اخیر ظهور کردهاند و تعامل انسانی و تایپ کردن را به فهرست طولانی برنامهها اضافه کردهاند. این شامل ChatGPT، یک LLM است که از زمان معرفی آن کمتر از دو سال پیش تأثیر عمیقی داشته است. این نرم افزار بحث (و بحث) قابل توجهی را در مورد کاربردهای بالقوه و پیامدهای هوش مصنوعی برانگیخته است.
نجوم همچنین مزایای زیادی دارد، جایی که یادگیری ماشینی برای مرتبسازی حجم عظیمی از دادهها برای جستجوی نشانههای گذر سیارهای، تصحیح اختلالات جوی و یافتن الگوهای نویز استفاده میشود. به گفته یک تیم بینالمللی از اخترفیزیکدانان، این میتواند تنها آغاز کاری باشد که هوش مصنوعی میتواند برای نجوم انجام دهد. که در مطالعه اخیر، این تیم یک مدل ترانسفورماتور از پیش آموزش دیده (GPT) را با استفاده از مشاهدات اجرام نجومی اصلاح کردند. در این فرآیند، آنها با موفقیت نشان دادهاند که مدلهای GPT میتوانند به طور موثر به تحقیقات علمی کمک کنند.
مطالعه توسط مرکز بین المللی شبکه اخترفیزیک نسبیتی (ICRANet)، یک کنسرسیوم بین المللی متشکل از محققان از مرکز بین المللی اخترفیزیک نسبیتی (ICRA)، در موسسه ملی اخترفیزیک (INAF)، دانشگاه علم و صنعت چین، موسسه فیزیک انرژی بالا، آکادمی علوم چین (CAS-IHEP)، دانشگاه پادوآ، دانشگاه صنعتی اصفهان و دانشگاه فریرا. پیش چاپ مقاله آنها،تست تنظیم دقیق GPT با استفاده از داده های اخترفیزیکی“، اخیراً در فضای مجازی ظاهر شد.
همانطور که گفته شد، اخترشناسان برای مرتبسازی حجم دادههای بهدستآمده توسط تلسکوپها و ابزار مدرن، به شدت به الگوریتمهای یادگیری ماشینی تکیه میکنند. این عمل حدود یک دهه پیش آغاز شد و از آن زمان با جهش و مرزهای گسترده ای رشد کرد تا جایی که هوش مصنوعی در کل فرآیند تحقیق ادغام شد. همانطور که یو وانگ رئیس ICRA و نویسنده اصلی مطالعه از طریق ایمیل به Universe Today گفت:
نجوم همیشه مبتنی بر داده بوده است و ستاره شناسان از اولین دانشمندانی بودند که یادگیری ماشین را پذیرفتند و از آن استفاده کردند. یادگیری ماشین اکنون در کل فرآیند تحقیقات نجومی، از تولید و کنترل تلسکوپهای زمینی و فضایی (مانند بهینهسازی عملکرد سیستمهای نوری تطبیقی، بهبود شروع اقدامات خاص (محرکها) ماهوارهها تحت شرایط خاص، ادغام شده است. و غیره)، برای تجزیه و تحلیل داده ها (مانند حذف نویز، انتساب داده ها، طبقه بندی، شبیه سازی و غیره) و ایجاد و اعتبارسنجی مدل های نظری (مانند آزمایش گرانش اصلاح شده، محدود کردن معادله حالت برای ستاره های نوترونی و غیره).
تجزیه و تحلیل داده رایج ترین این برنامه ها باقی می ماند، زیرا ساده ترین حوزه ای است که یادگیری ماشین را می توان در آن ادغام کرد. به طور سنتی، ده ها محقق و صدها شهروند دانشمند حجم داده های تولید شده توسط یک کمپین نظارتی را تجزیه و تحلیل می کنند. با این حال، در عصری که تلسکوپ های مدرن هر روز ترابایت داده جمع آوری می کنند، این عملی نیست. این شامل بررسی های سراسر آسمان مانند بررسی آسمان آرایه بسیار بزرگ (VLASS) و بسیاری از مراحل انجام شده توسط بررسی آسمان دیجیتال اسلون (SDSS).
تا به امروز، LLM ها تنها به صورت پراکنده در تحقیقات نجومی به کار گرفته شده اند، با توجه به اینکه آنها یک ساخته نسبتاً جدید هستند. اما به گفته طرفدارانی مانند وانگ، تأثیر زیادی بر جامعه داشته است و پتانسیل یک کران پایینی معادل «انقلاب صنعتی» را دارد. در مورد حد بالایی، وانگ پیشبینی میکند که میتواند بسیار متفاوت باشد و شاید به “روشنگری یا نابودی” بشریت منجر شود. با این حال، برخلاف انقلاب صنعتی، سرعت تغییر و ادغام برای هوش مصنوعی بسیار سریعتر است و این پرسشها را در مورد اینکه پذیرش آن تا کجا پیش خواهد رفت، ایجاد میکند.
وانگ گفت که برای تعیین پتانسیل آن برای رشته نجوم، او و همکارانش یک مدل GPT از پیش آموزش دیده را انتخاب کردند و آن را برای شناسایی پدیده های نجومی تنظیم کردند:
“OpenAI مدل های از پیش آموزش دیده را ارائه می دهد و کاری که ما انجام داده ایم تنظیم دقیقی است که شامل تغییر برخی پارامترها بر اساس مدل اصلی است و به آن امکان می دهد داده های نجومی را تشخیص دهد و نتایج را از آن داده ها محاسبه کند. به نوعی مانند OpenAI است که دانشجویی را به ما ارائه می دهد که پس از آن برای تبدیل شدن به یک دانشجوی فارغ التحصیل در رشته نجوم آموزش دادیم.
ما داده های محدودی با وضوح متوسط ارائه کردیم و GPT را کمتر از مدل های معمولی آموزش دادیم. با این حال، نتایج چشمگیر هستند و به دقت حدود 90٪ دست می یابند. این سطح بالای دقت به دلیل پایه قوی GPT است که از قبل پردازش داده ها را درک کرده و دارای قابلیت های استدلال و همچنین مهارت های ارتباطی است.
این تیم برای تنظیم دقیق مدل خود، مشاهداتی از پدیده های نجومی مختلف که از کاتالوگ های مختلف گرفته شده بودند را وارد کردند. این شامل 2000 نمونه اختروش، کهکشان، ستاره و اختروش خط جذب گسترده (BAL) از SDSS (هر کدام 500) است. آنها همچنین مشاهدات انفجارهای کوتاه و بلند پرتو گاما (GRBs)، کهکشان ها، ستارگان و شبیه سازی سیاهچاله ها را ادغام کردند. هنگامی که آزمایش شد، مدل آنها با موفقیت پدیده های مختلف را طبقه بندی کرد، انواع اختروش ها را متمایز کرد، فاصله آنها را بر اساس انتقال به سرخ استنباط کرد، و چرخش و تمایل سیاهچاله ها را اندازه گرفت.
وانگ گفت: “این کار حداقل نشان می دهد که LLM ها قادر به پردازش داده های نجومی هستند.” علاوه بر این، توانایی یک مدل برای مدیریت انواع مختلف دادههای نجومی، قابلیتی است که سایر مدلهای تخصصی از آن برخوردار نیستند. ما امیدواریم که LLM ها بتوانند انواع مختلف داده ها را ادغام کنند و سپس اصول اساسی مشترک را شناسایی کنند تا به ما در درک جهان کمک کنند. البته، این یک کار چالش برانگیز است و اخترشناسان به تنهایی نمی توانند آن را انجام دهند.
البته، تیم اعتراف می کند که مجموعه داده ای که آنها با آن آزمایش کردند در مقایسه با داده های خام رصدخانه های مدرن بسیار ناچیز است. این امر به ویژه برای تجهیزات نسل بعدی مانند رصدخانه Vera C. Rubinکه اخیراً دوربین LSST خود را دریافت کرده است، بزرگترین دوربین دیجیتال جهان! وقتی روبین راه اندازی شد، دوره ده ساله را اجرا خواهد کرد کاوش ارثی فضا و زمان (LSST) که انتظار می رود هر شب 15 ترابایت داده تولید کند! وانگ میگوید برآورده کردن خواستههای کمپینهای آتی نیازمند بهبود و همکاری بین رصدخانهها و شرکتهای حرفهای هوش مصنوعی است.
با این حال، این یک نتیجه گیری قبلی است که در آینده نزدیک برنامه های کاربردی LLM بیشتری برای نجوم وجود خواهد داشت. این نه تنها یک پیشرفت محتمل است، بلکه با توجه به حجم وسیعی از دادههایی که امروزه تحقیقات نجومی تولید میکنند، ضروری است. و از آنجایی که احتمالاً در آینده نزدیک این میزان به طور تصاعدی افزایش خواهد یافت، هوش مصنوعی احتمالاً در زمینه تحقیقات ضروری است.
اطلاعات بیشتر: arXiv