روش تعامل ما با فناوری به‌طور مداوم در حال تحول است. یکی از هیجان‌انگیزترین پیشرفت‌های اخیر در عرصه هوش مصنوعی (AI) رخ داده است، جایی که ماشین‌ها آموزش دیده‌اند تا مانند انسان‌ها فکر کنند، یاد بگیرند و حتی ارتباط برقرار کنند. در میان توسعه‌های گسترده در زمینه‌هایی مانند هوش مصنوعی، هنر ظریفی در حال ظهور است: مهندسی پرامپت یا Prompt Engineering. اگر می‌خواهید درباره پیچیدگی‌های فنی Prompt Engineering بدانید، به خواندن این مطلب ادامه دهید. ما اهمیت مهندسی پرامپت را در چشم‌انداز گسترده‌تر AI بررسی می‌کنیم؛ همچنین برای کسانی که مایل‌اند به‌طور عمیق‌تری به دنیای AI و پردازش زبان طبیعی بپردازند، مجموعه‌ای از منابع را برای کمک به یادگیری بیشتر معرفی می‌کنیم.

فهرست مطالب پنهان‌کردن فهرست
  1. 1. مهندسی پرامپت چیست؟
    1. 1.1. مهندسی پرامپت به چه معناست؟
  2. 2. جنبه فنی مهندسی پرامپت
    1. 2.1. معماری‌های مدل
    2. 2.2. داده‌های آموزشی و توکن‌سازی
    3. 2.3. پارامترهای مدل
    4. 2.4. تنظیمات Temperature و نمونه‌برداری Top-k
    5. 2.5. توابع زیان و شیب‌ها
  3. 3. چرا مهندسی Prompt اهمیت دارد؟
  4. 4. مهندسی پرسش چه تکاملی را طی کرده است؟
    1. 4.1. روزهای اولیه NLP
    2. 4.2. NLP آماری و یادگیری ماشین
    3. 4.3. ظهور مدل‌های مبتنی بر ترانسفورمر
    4. 4.4. تأثیرات مدل‌های GPT شرکت OpenAI
    5. 4.5. مهندسی دستورعمل امروزه
  5. 5. تازه‌ترین تحولات در مهندسی دستورعمل
    1. 5.1. درک بهتر متن
    2. 5.2. تکنیک‌های دستورعمل سازگار
    3. 5.3. مهندسی دستورعمل چندوجهی
    4. 5.4. بهینه‌سازی دستورعمل در زمان واقعی (Real-Time)
    5. 5.5. ادغام با مدل‌های تخصصی
  6. 6. هنر و علم طراحی دستورعمل‌ها
    1. 6.1. هوشمندی‌های دستورعمل‌نویسی
  7. 7. مؤلفه‌های کلیدی یک دستور یا Prompt
    1. 7.1. دستورعمل
    2. 7.2. زمینه
    3. 7.3. داده‌های ورودی
    4. 7.4. نشانگر خروجی
  8. 8. تکنیک‌های مهندسی پرامپت
    1. 8.1. تکنیک‌های پایه
    2. 8.2. تکنیک‌های پیشرفته
  9. 9. مهندسی پرسش چگونه کار می‌کند؟
    1. 9.1. ایجاد یک پرسش مناسب
    2. 9.2. تکرار و ارزیابی
    3. 9.3. تنظیم (fine-tune) نهایی
  10. 10. نقش مهندس پرامپت در هوش مصنوعی
    1. 10.1. مسیر شغلی جدید در هوش مصنوعی
  11. 11. مهارت‌های فنی برای مهندسی Prompt
  12. 12. مهارت‌های غیرفنی برای مهندسی پرامپت
  13. 13. آینده مهندسی پرامپت
    1. 13.1. توسعه دستورهای سازگار
    2. 13.2. توسعه دستورهای چندحالتی
    3. 13.3. توسعه دستورهای اخلاقی
    4. 13.4. ارزش و اهمیت بلندمدت
  14. 14. چالش‌ها و فرصت‌ها
  15. 15. نکته نهایی درباره مهندسی پرامپت
  16. 16. یک مهندس پرامپت چه کاری انجام می‌دهد؟
  17. 17. چگونه یک مهندس پرامپت شویم؟
    1. 17.1. تسلط بر پایتون
    2. 17.2. درک اصول اولیه هوش مصنوعی
    3. 17.3. یادگیری پردازش زبان طبیعی (NLP)
    4. 17.4. یادگیری یادگیری عمیق و مدل‌های ترانسفورمر
    5. 17.5. کار عملی با مدل‌های پیش‌آموزش‌دیده
    6. 17.6. تنظیم دقیق (Fine-tuning) برای برنامه‌های سفارشی
    7. 17.7. تسلط بر هنر ساخت پرامپت
    8. 17.8. تکنیک‌های پیشرفته پرامپت‌نویسی
    9. 17.9. پروژه‌های دنیای واقعی و ساخت پورتفولیو
    10. 17.10. به یادگیری ادامه دهید و با جامعه هوش مصنوعی تعامل کنید
  18. 18. بهترین پرامپت‌های هوش مصنوعی برای هر کاری!
    1. 18.1. پیاده‌سازی پرامپت‌های Prompt Library
      1. 18.1.1. ChatGPT Playground چیست و چه تفاوتی با ChatGPT دارد؟
      2. 18.1.2. ویژگی‌ها
      3. 18.1.3. کاربردها
      4. 18.1.4. تفاوت‌ها با ChatGPT
    2. 18.2. System Prompt و User Prompt به چه معنی هستند؟
      1. 18.2.1. System Prompt
      2. 18.2.2. User Prompt
      3. 18.2.3. نکات مهم در مورد System Prompt و User Prompt
  19. 19. نتیجه‌گیری
  20. 20. پرسش‌های متداول
    1. 20.1. دستورعمل یا پرامپت (Prompt) در زمینه هوش مصنوعی دقیقاً به چه معناست؟
    2. 20.2. چرا مهندسی دستورعمل مهم است؟
    3. 20.3. آیا برای درک مهندسی دستورعمل به پیش‌زمینه‌ای در هوش مصنوعی یا یادگیری ماشین نیاز دارم؟
    4. 20.4. مهندسی دستورعمل چگونه به چت‌بات‌ها و دستیارهای صوتی مرتبط است؟
    5. 20.5. آیا خطراتی هم در مهندسی دستورعمل وجود دارد؟
  21. 21. یادگیری دیتا ساینس را از امروز شروع کنید!

مهندسی پرامپت چیست؟

در اصل، مهندسی پریش یا پرامپت مانند آموزش یک کودک از طریق پرسش‌ها است. همانطور که یک سوال خوب می‌تواند فرآیند تفکر یک کودک را هدایت کند، یک پرسش درست و مناسب می‌تواند یک مدل هوش مصنوعی، به خصوص مدل‌های زبان بزرگ (LLM)، را به سمت خروجی مشخصی هدایت کند. بیایید این مفهوم را به طور دقیق‌تر بررسی کنیم.

مهندسی پرامپت به چه معناست؟

تصور کنید در حال گفت‌وگو با یک ماشین هستید؛ شما یک پرسش مطرح می‌کنید و در پاسخ، ماشین با اطلاعات یا اقدامات مناسب واکنش نشان می‌دهد. طرز پرسش‌کردن شما ماهیت مهندسی پرامپت است. این حوزه به خلق پرسش‌ها یا دستورعمل‌هایی می‌پردازد که به‌طور مؤثر مدل‌های هوش مصنوعی، به‌ویژه مدل‌های بزرگ زبانی، را برای دست‌یابی به خروجی‌های مدنظر هدایت می‌کند. چه علاقه‌مند به فناوری باشید و مشتاق دانستن آخرین پیشرفت‌های AI و چه یک حرفه‌ای در جست‌وجوی استفاده از توانایی‌های مدل‌های زبانی، درک عمیق مهندسی پرسش برای شما ضروری است.

مهندسی پرسش یا مهندسی پرامپت عمل طراحی و اصلاح پرسش‌ها، سؤالات یا دستورعمل‌ها برای دریافت پاسخ‌های مشخص از مدل‌های هوش مصنوعی است. این فرایند را به‌عنوان رابط میان نیت انسانی و خروجی ماشین در نظر بگیرید.

در عرصه وسیع هوش مصنوعی، جایی که مدل‌ها با داده‌های عظیم آموزش می‌بینند، یک پرسش درست می‌تواند تفاوت میان فهمیدن درخواست شما یا برداشت اشتباه از آن را ایجاد کند.

برای مثال، اگر شما تا به حال با دستیارهای صوتی مانند سیری یا الکسا تعامل کرده‌ باشید، در یک شکل پایه‌ای از مهندسی پرسش شرکت کرده‌اید. نحوه بیان درخواست شما مثلاً موسیقی آرامش‌بخش پخش کن، در مقابل سمفونی بتهوون را پخش کن، می‌تواند نتایج بسیار متفاوتی به همراه داشته باشد.

جنبه فنی مهندسی پرامپت

مهندسی پرامپت، درحالی‌که در هنر زبان ریشه دارد، به‌شدت با جزئیات فنی مدل‌های هوش مصنوعی گره خورده است. در اینجا نگاه دقیق‌تری به جنبه فنی می‌اندازیم:

معماری‌های مدل

 مدل‌های زبان بزرگ مانند GPT و PaLM2 گوگل (جمنای را قدرت می‌بخشد) بر پایه معماری‌های مبدل ساخته شده‌اند. این معماری‌ها به مدل‌ها اجازه می‌دهند که حجم عظیمی از داده‌ها را مدیریت کنند و ازطریق مکانیزم‌های خودتوجه، متن را درک کنند. طراحی پرسش‌های مؤثر اغلب به درک این معماری‌های زیربنایی نیازمند است.

داده‌های آموزشی و توکن‌سازی

LLM‌ها با داده‌های وسیع آموزش‌دیده داده‌های ورودی را به قطعه‌های کوچک‌تر (توکن‌ها) برای پردازش تقسیم می‌کنند. انتخاب توکن‌سازی (براساس کلمه، جفت بایت و غیره) می‌تواند بر تفسیر مدل از یک پرسش تأثیری بگذارد؛ برای مثال، یک کلمه که به‌شکل متفاوتی توکن‌سازی‌شده ممکن است خروجی‌های متفاوتی ایجاد کند.

پارامترهای مدل

LLM‌ها میلیون‌ها، اگر نه میلیارد‌ها، پارامتر دارند. این پارامترها که در طی فرایند آموزش تنظیم می‌شوند، تعیین می‌کنند که مدل چگونه به یک پرسش پاسخ می‌دهد. درک رابطه میان این پارامترها و خروجی‌های مدل می‌تواند در طراحی پرسش‌های مؤثرتر کمک کند.

تنظیمات Temperature و نمونه‌برداری Top-k

هنگام تولید پاسخ‌ها، مدل‌ها از تکنیک‌هایی مانند تنظیم دما (Temperature) و نمونه‌برداری Top-k برای تعیین تصادفی‌بودن و تنوع خروجی‌ها استفاده می‌کنند؛ برای مثال، دمای بالاتر ممکن است پاسخ‌های متنوع‌تری (اما احتمالاً کم‌دقت‌تر) ایجاد کند. مهندسان پرسش اغلب این تنظیمات را برای بهینه‌سازی خروجی‌های مدل تنظیم می‌کنند.

توابع زیان و شیب‌ها

در سطح عمیق‌تر، رفتار مدل در پاسخ به پرسش تحت‌تأثیر توابع زیان و شیب‌های آن قرار دارد. این سازه‌های ریاضی فرایند یادگیری مدل را هدایت می‌کنند. درحالی‌که مهندسان پرسش معمولاً به‌طور مستقیم این‌ها را تنظیم نمی‌کنند، درک تأثیر آن‌ها می‌تواند بینش‌هایی درمورد رفتار مدل ارائه کند.

چرا مهندسی Prompt اهمیت دارد؟

در دوره‌ای که استفاده از هوش مصنوعی، از چت‌بات‌ها در خدمات مشتری گرفته تا تولیدکنندگان محتوای هوشمند، امر رایج است، مهندسی پرامپت نقش حیاتی ایفا می‌کند تا اطمینان حاصل شود که ارتباط میان انسان و ماشین به‌طور مؤثری برقرار می‌شود. این فرایند فقط به به‌دست‌آوردن پاسخ درست محدود نمی‌شود، بلکه این امر اهمیت بالایی دارد که هوش مصنوعی توانایی درک زمینه، ظرایف و هدف هر پرسش را داشته باشد.

مهندسی پرسش چه تکاملی را طی کرده است؟

مهندسی پرس‌وجو، گرچه رشته‌ای نسبتاً جدید است، ریشه‌های عمیقی در تاریخچه پردازش زبان طبیعی (NLP) و یادگیری ماشین دارد. درک تکامل آن به ما زمینه‌ درک اهمیت کنونی‌اش را می‌دهد که در ادامه به آن پرداخته‌ایم.

روزهای اولیه NLP

مبدأ پردازش زبان طبیعی به اواسط قرن بیستم بازمی‌گردد، همزمان با ظهور رایانه‌های دیجیتال. تلاش‌های اولیه در NLP بر پایه قواعد بود و به قوانین دستی و الگوریتم‌های ساده تکیه می‌کرد. این سیستم‌ها سفت‌وسخت بودند و با پیچیدگی‌ها و ظرافت‌های زبان انسانی به‌سختی دست‌وپنجه نرم می‌کردند.

NLP آماری و یادگیری ماشین

با افزایش قدرت محاسباتی و رشد مجموعه‌های داده، دهه‌های پایانی قرن بیستم و اوایل قرن بیست‌ویکم شاهد گرایش به روش‌های آماری بودند. الگوریتم‌های یادگیری ماشین نقش محوری به خود گرفتند و امکان مدل‌های زبانی انعطاف‌پذیر و مبتنی بر داده را فراهم کردند؛ بااین‌حال این مدل‌ها هنوز محدودیت‌هایی در درک زمینه و تولید متن طولانی منسجم داشتند.

ظهور مدل‌های مبتنی بر ترانسفورمر

معرفی معماری ترانسفورمر در مقاله Attention is all you need در سال ۲۰۱۷ یک نقطه‌عطف بود. ترانسفورمرها، با مکانیسم‌های خودتوجه خود، توانایی پردازش حجم عظیمی از داده‌ها و الگوهای پیچیده‌ی زبانی را داشتند. این توانایی به توسعه مدل‌هایی مانند BERT گوگل انجامید که در وظایفی مانند طبقه‌بندی متن و تحلیل احساسات انقلابی ایجاد کرد.

تأثیرات مدل‌های GPT شرکت OpenAI

سری ترانسفورمرهای پیش‌آموزی‌شده مولد (GPT) شرکت OpenAI، به‌ویژه GPT-2 و GPT-3، استانداردهای جدیدی در عرصه ترانسفورمرها بنا کردند. این مدل‌ها، با میلیاردها پارامتر خود، توانایی بی‌سابقه‌ای در تولید متون هماهنگ و مرتبط با زمینه را نمایش دادند. ظهور مدل‌های GPT به اهمیت مهندسی دستورعمل‌ها اشاره کرد؛ زیرا کیفیت خروجی‌ها به‌طور چشمگیری به دقت و وضوح دستورعمل‌ها بستگی داشت.

مهندسی دستورعمل امروزه

با گسترش استفاده از مدل‌های مبتنی بر ترانسفورمر در صنایع، تحقیقات و کاربردهای روزمره، مهندسی دستورعمل به یک رشته حیاتی تبدیل شده است. این رشته پلی است که اطمینان می‌دهد این مدل‌های قدرتمند به‌طور مؤثری به کار گرفته شوند و ابزارهای هوش مصنوعی دردسترس‌تر و کاربرپسندتر شوند.

چه برای آزادسازی خلاقیت با هوش مصنوعی مولد یا استفاده از ChatGPT برای پروژه‌های علم داده باشد، درک نحوه کارکرد دستورعمل‌ها روزبه‌روز مهم‌تر می‌شود.

تازه‌ترین تحولات در مهندسی دستورعمل

از اوایل سال ۲۰۲۴ حوزه مهندسی دستورعمل به‌سرعت در حال تکامل است و بازتاب‌دهنده ماهیت پویای هوش مصنوعی و کاربردهای آن است. پیشرفت‌های اخیر بر نحوه تعامل ما با مدل‌های هوش مصنوعی، به‌ویژه مدل‌های بزرگ زبانی (LLMs)، تأثیر چشمگیری گذاشته‌اند. در اینجا برخی از مهم‌ترین توسعه‌ها آمده است:

درک بهتر متن

پیشرفت‌های اخیر در LLM‌ها، به‌ویژه در مدل‌هایی مانند GPT-4 و مدل‌های پیشرفته‌تر، بهبود قابل توجهی در درک زمینه و ظرافت‌های زبانی نشان داده‌اند. این مدل‌ها اکنون بهتر می‌توانند دستورعمل‌های پیچیده را تفسیر کنند، زمینه‌های گسترده‌تری را در نظر بگیرند و پاسخ‌های دقیق‌تر و ظریف‌تری ارائه کنند. این پیشرفت تا حد زیادی به روش‌های آموزش پیچیده‌تر که شامل مجموعه‌های داده گسترده و متنوع می‌شوند بستگی دارد و به مدل‌ها امکان می‌دهد subtleties زبان انسانی را بهتر درک کنند.

تکنیک‌های دستورعمل سازگار

تکنیک‌های دستورعمل سازگار روند نوظهوری است که در آن مدل‌های هوش مصنوعی در حال توسعه هستند تا پاسخ‌های خود را براساس سبک و ترجیحات کاربر تنظیم کنند. این رویکرد شخصی‌سازی با هدف ایجاد تعاملات طبیعی‌تر و کاربرپسندتر با هوش مصنوعی است؛ برای مثال، اگر کاربر به‌طور معمول سؤالات مختصری بپرسد، هوش مصنوعی به‌گونه‌ای تنظیم می‌شود که پاسخ‌های مختصری ارائه کند و برعکس. این توسعه، به‌ویژه، در بهبود تجربه کاربر در برنامه‌های مبتنی بر هوش مصنوعی مانند دستیارهای مجازی و چت‌بات‌ها امیدوارکننده است.

مهندسی دستورعمل چندوجهی

ادغام قابلیت‌های چندوجهی در مدل‌های هوش مصنوعی مرزهای جدیدی در مهندسی دستورعمل گشوده است. مدل‌های چندوجهی می‌توانند دستورعمل‌هایی را که ترکیبی از متن، تصویر و گاهی حتی ورودی‌های صوتی شامل باشند پردازش کنند و به آن‌ها پاسخ دهند. این پیشرفت قابل‌توجه است؛ زیرا راه را برای برنامه‌های کاربردی هوش مصنوعی جامع‌تری هموار می‌کند که می‌توانند درک و تعاملی شبیه به ادراک و ارتباط انسانی داشته باشند.

بهینه‌سازی دستورعمل در زمان واقعی (Real-Time)

پیشرفت‌ها در فناوری بهینه‌سازی دستورعمل در زمان واقعی امکان داده‌اند که مدل‌های هوش مصنوعی بازخورد فوری درمورد اثربخشی دستورعمل‌ها ارائه کنند. این فناوری وضوح دستورعمل پتانسیل برای تعصب و هم‌راستایی با نتیجه مطلوب را ارزیابی می‌کند و پیشنهادهایی برای بهبود ارائه می‌کند. این راهنمایی‌های زمان واقعی برای کاربران تازه‌کار و باتجربه ارزشمند است و فرایند طراحی دستورعمل‌های مؤثر را تسهیل می‌کند.

ادغام با مدل‌های تخصصی

مهندسی دستورعمل نیز با مدل‌های هوش مصنوعی تخصصی ادغام می‌شود. این مدل‌های تخصصی براساس داده‌های خاص صنعت آموزش دیده‌اند که امکان پاسخ‌های دقیق‌تر و مرتبط‌تر به دستورعمل‌ها در حوزه‌هایی مانند پزشکی، حقوق و مالی را فراهم می‌آورد. ترکیب مهندسی دستورعمل با این مدل‌های سفارشی دقت و کاربرد هوش مصنوعی در حوزه‌های تخصصی را افزایش می‌دهد.

هنر و علم طراحی دستورعمل‌ها

طراحی یک دستورعمل مؤثر هم هنر است و هم علم. یک هنر است، زیرا به خلاقیت، شهود و درک عمیقی از زبان نیاز دارد و علم است، چون براساس مکانیک‌های پردازش و تولید پاسخ‌ها توسط مدل‌های هوش مصنوعی استوار است.

هوشمندی‌های دستورعمل‌نویسی

هر کلمه در یک دستورعمل اهمیت دارد. تغییر جزئی در عبارت‌بندی می‌تواند به خروجی‌های کاملاً متفاوت از مدل هوش مصنوعی بینجامد؛ برای مثال، درخواست از مدل برای «توصیف برج ایفل» درمقابل «بیان تاریخ برج ایفل» پاسخ‌های متفاوتی را به دنبال خواهد داشت. اولی ممکن است توصیفی فیزیکی ارائه کند، درحالی‌که دومی به اهمیت تاریخی آن می‌پردازد.

درک این ظرافت‌ها ضروری است، به‌خصوص هنگام کار با مدل‌های زبان بزرگ. این مدل‌ها که با داده‌های عظیم آموزش دیده‌اند می‌توانند براساس سرنخ‌هایی که دریافت می‌کنند طیف گسترده‌ای از پاسخ‌ها را تولید کنند. موضوع صرفاً پرسیدن یک سؤال نیست، بلکه باید به‌گونه‌ای عبارت‌بندی شود که با نتیجه مدنظر شما هماهنگ باشد.

مؤلفه‌های کلیدی یک دستور یا Prompt

بیایید به جنبه‌هایی که یک دستور خوب را تشکیل می‌دهند نگاهی بیندازیم:

دستورعمل

این هسته اصلی دستور است. به مدل می‌گوید که شما چه انتظاری دارید انجام دهد؛ برای مثال، «متن زیر را خلاصه کنید» یک عمل مشخص برای مدل فراهم می‌کند.

زمینه

زمینه اطلاعات اضافی را فراهم می‌کند که به مدل کمک می‌کند تا سناریوی گسترده‌تر یا پس‌زمینه را درک کند؛ برای مثال، «با توجه به رکود اقتصادی، مشاوره سرمایه‌گذاری ارائه دهید» به مدل پس‌زمینه‌ای می‌دهد که در آن پاسخ خود را قالب‌بندی کند.

داده‌های ورودی

این داده‌های خاصی هستند که شما می‌خواهید مدل پردازش کند. ممکن است یک پاراگراف، مجموعه‌ای از اعداد یا حتی یک کلمه باشد.

نشانگر خروجی

به‌خصوص در سناریوهای نقش‌آفرینی این عنصر به مدل درباره قالب یا نوع پاسخ مدنظر راهنمایی‌هایی را ارائه می‌کند؛ برای مثال، «با سبک شکسپیر، این جمله را بازنویسی کنید» به مدل یک جهت سبکی می‌دهد.

تکنیک‌های مهندسی پرامپت

طراحی یک پرس‌وجوی ایده‌آل اغلب آزمون‌وخطا را در بر می‌گیرد. در اینجا برخی تکنیک‌هایی را معرفی می‌کنیم که می‌توانند کمک‌کننده باشند:

تکنیک‌های پایه

این نکاتی هستند که کاربران معمولی می‌توانند برای بهبود پرس‌وجوهای خود از آن‌ها استفاده کنند:

  • ایجاد نقش: با درنظرگرفتن نقش‌های خاص برای مدل، مانند یک تاریخ‌دان یا دانشمند، می‌توانید پاسخ‌هایی مخصوص به دریافت کنید؛ برای مثال، پرسش «به‌عنوان یک متخصص تغذیه، این برنامه غذایی را ارزیابی کنید» ممکن است پاسخی مبتنی بر علم تغذیه ارائه کند.
  • تصحیح تدریجی: با یک پرس‌وجوی عمومی شروع کنید و براساس پاسخ‌های مدل آن را تدریجاً دقیق‌تر کنید. این فرایند تکراری به بهینه‌سازی پرس‌وجو کمک می‌کند.
  • حلقه‌های بازخورد: از خروجی‌های مدل برای اطلاع و تنظیم پرس‌وجوهای بعدی استفاده کنید. این تعامل پویا اطمینان می‌دهد که پاسخ‌های مدل با انتظارات کاربر به‌مرور زمان هم‌راستا شوند.

برای مشاهده کامل وبینار رایگان یادگیری ماشین لرنینگ و تحلیل داده با ChatGPT کلیک کنید.

تکنیک‌های پیشرفته

در این قسمت استراتژی‌های پیچیده‌تری را می‌بینیم که به درک عمیق‌تری از رفتار مدل نیاز دارند:

  • Zero-shot prompting: این تکنیک دادن یک وظیفه به مدل را شامل است که در طول آموزش خود با آن مواجه نشده است. این تست قابلیت تعمیم مدل و تولید خروجی‌های مرتبط بدون تکیه بر نمونه‌های قبلی است.
  • Few-shot prompting: در اینجا مدل با چند نمونه (شات) راهنمایی می‌شود تا پاسخی دقیق تولید کند و یادگیری در متن داشته باشد. با فراهم‌آوردن زمینه یا موارد قبلی، مدل می‌تواند خروجی مدنظر را بهتر درک و تولید کند؛برای مثال، نشان‌دادن چندین مثال از جمله‌های ترجمه‌شده به مدل قبل از درخواست ترجمه یک جمله جدید.
  • زنجیره افکار (Chain-of-Thought): این تکنیک پیشرفته که صورت CoT هم بیان می‌شودهدایت مدل ازطریق یک سری مرحله‌های استدلال را شامل است. با تقسیم یک وظیفه پیچیده به مرحله‌های میانی یا زنجیره‌های استدلال، مدل می‌تواند درک بهتری از زبان داشته باشد و خروجی‌های دقیق‌تری تولید کند. این شبیه به راهنمایی قدم‌به‌قدم کسی ازطریق یک مسئله ریاضی پیچیده است.

مهندسی پرسش چگونه کار می‌کند؟

تنظیم اولیه پرسش فقط آغاز کار است. برای بهره‌گیری واقعی از قدرت مدل‌های هوش مصنوعی و تضمین هم‌راستایی آن‌ها با هدف کاربران، تصحیح و بهینه‌سازی پرسش‌ها ضروری است. این فرایند تکراری ترکیبی از هنر و علم است که نیازمند هم شهود و هم بینش‌های مبتنی بر داده است.

ایجاد یک پرسش مناسب

  • وضوح مهم و تعیین‌کننده است: اطمینان حاصل کنید که پرسش واضح و بدون ابهام است. از اصطلاحات تخصصی پرهیز کنید، مگر آنکه برای زمینه خاص ضروری باشد.
  • از محدودیت‌ها استفاده کنید: تعیین مرزها یا محدودیت‌ها می‌تواند مدل را به‌سمت خروجی مطلوب هدایت کند؛ برای مثال، «برج ایفل را در سه جمله توصیف کنید» محدودیت واضحی در طول ارائه می‌کند.
  • از پرسش‌های دارای سوگیری پرهیز کنید: این پرسش‌ها می‌توانند خروجی مدل را دستکاری کنند و مهم است که بی‌طرف باقی بمانید تا پاسخی بی‌طرف دریافت کنید.

تکرار و ارزیابی

فرایند پالایش پرسش‌ها به‌صورت تکراری است. در اینجا یک جریان کاری معمولی به‌این شرح است:

  • براساس وظیفه مدنظر و خروجی مدنظر پرسش اولیه را بنویسید.
  • پرسش را با استفاده از مدل هوش مصنوعی برای تولید پاسخ آزمایش کنید.
  • خروجی را ارزیابی کنید و بررسی کنید که آیا پاسخ با هدف مدنظر هم‌خوانی دارد و معیارها را برآورده می‌کند یا نه.
  • پرسش را براساس ارزیابی‌ها پالایش کنید و تنظیمات لازم را اعمال کنید.
  • این فرایند را تا رسیدن به کیفیت خروجی مطلوب ادامه دهید و تکرار کنید.

در طول این فرایند همچنین ضروری است که ورودی‌های متنوع و سناریوهای مختلف را در نظر بگیرید تا از کارآمدی پرسش در طیف گسترده‌ای از شرایط اطمینان حاصل کنید.

تنظیم (fine-tune) نهایی

فراتر از پالایش خود پرسش همچنین امکان تنظیم یا تعمیر نهایی مدل هوش مصنوعی وجود دارد. این شامل تغییر پارامترهای مدل برای هماهنگ‌سازی بهتر با وظایف خاص یا مجموعه‌داده‌ها است. اگرچه این یک تکنیک پیشرفته‌تر است، می‌تواند عملکرد مدل را برای کاربردهای تخصصی به طور چشمگیری بهبود بخشد.

نقش مهندس پرامپت در هوش مصنوعی

با ادامه ورود هوش مصنوعی در صنایع و بازتعریف نحوه تعامل ما با فناوری، شغل جدیدی به‌نام مهندس پرامپت پدید آمده است. این نقش در ایجاد پل میان اهداف انسان و درک ماشین بسیار کارآمد است و اطمینان حاصل می‌کند که مدل‌های هوش مصنوعی به طور مؤثر ارتباط برقرار می‌کنند و خروجی‌های مرتبط تولید می‌کنند.

مسیر شغلی جدید در هوش مصنوعی

پیشرفت‌های سریع در پردازش زبان طبیعی (NLP) و استقبال گسترده از مدل‌های بزرگ زبانی (LLMs) تقاضای متخصص برای افرادی که می‌توانند پرامپت‌های مؤثری طراحی کنند ایجاد کرده‌اند. این افراد که به‌عنوان مهندسان پرامپت شناخته می‌شوند صرفاً فنی‌کار نیستند، بلکه هنرمندانی هستند که ظرافت‌های زبان، بافت و رفتار هوش مصنوعی را درک می‌کنند.

همان‌طور که در مجله تایم و دیگر منابع گزارش شده است، شرکت‌ها، از غول‌های فناوری گرفته تا استارت‌آپ‌ها، ارزش نقش‌های تخصصی مهندسی پرامپت را درک می‌کنند. با گسترش استفاده از راه‌حل‌های هوش مصنوعی در محصولات و خدمات، دانش و تخصص مهندس پرامپت ضمانت می‌کند که این راه‌حل‌ها نه‌تنها مؤثر و کاربردی باشند، به‌خوبی با محیط و شرایط مرتبط و هم‌خوانی داشته باشند.

وب‌سایت‌های کاریابی مانند «ایندید» و «لینکدین» در حال حاضر هزاران شغل مهندس پرامپت را فقط در ایالات متحده امریکا فهرست کرده‌اند، با دستمزدهایی که از ۵۰،۰۰۰ دلار تا بیش از ۱۵۰،۰۰۰ دلار در سال متغیر است.

مهارت‌های فنی برای مهندسی Prompt

بسته به نقش دقیق و سطح فنی آن، یک مهندس پرامپت به داشتن دانش در زمینه‌های فنی زیر نیاز دارد:

  • درک NLP (پردازش زبان طبیعی): داشتن دانش عمیق از تکنیک‌ها و الگوریتم‌های پردازش زبان طبیعی ضروری است.
  • آشنایی با مدل‌های LLM: تجربه‌ای با مدل‌هایی مانند GPT، PaLM2 و دیگر مدل‌های نوظهور و معماری‌های آن‌ها.
  • تجربه‌ و تکرار: توانایی آزمایش، تصفیه و بهینه‌سازی پرامپت‌ها براساس خروجی‌های مدل.
  • تحلیل داده‌ها: تحلیل پاسخ‌های مدل، شناسایی الگوها و اتخاذ تصمیم‌های مبتنی بر داده.

مهارت‌های غیرفنی برای مهندسی پرامپت

درحالی‌که تبحر فنی حیاتی است، یک مهندس پرامپت همچنین به مجموعه‌ای از مهارت‌های غیرفنی نیاز دارد:

  • ارتباطات: توانایی انتقال ایده‌ها، همکاری با تیم‌ها و درک نیازهای کاربر.
  • تخصص در موضوع: بسته به کاربرد، داشتن دانش تخصصی در زمینه‌های خاص می‌تواند بسیار ارزشمند باشد.
  • تسلط بر زبان: مهارت در زبان، دستور زبان و معانی برای خلق پرامپت‌های مؤثر. زبان‌شناسان از بهترین افراد برای تبدیل‌شدن به مهندسان پرامپت هستند.
  • تفکر نقادانه: ارزیابی خروجی‌های مدل، شناسایی سوگیری‌ها و تضمین عملکردهای اخلاقی در هوش مصنوعی.
  • خلاقیت: فکرکردن خارج از چارچوب، آزمایش با سبک‌های جدید فوری و نوآوری در راه‌حل‌ها.

این مهارت‌های نرم، همراه با تخصص فنی، نقش مهندس پرامپت را هم چالش‌برانگیز و هم ارزش‌آفرین می‌کند و راه را برای عصر جدیدی از همکاری انسان و هوش مصنوعی هموار می‌کند.

آینده مهندسی پرامپت

در آستانه عصر هوش مصنوعی قرار داریم و مهندسی پرامپت نقش محوری در شکل‌گیری آینده تعاملات انسان و هوش مصنوعی خواهد داشت. این حوزه، با وجود تازگی‌اش، ظرفیت زیادی برای رشد دارد.

توسعه دستورهای سازگار

پژوهشگران در جست‌وجوی راه‌هایی هستند که مدل‌ها بتوانند براساس زمینه به‌طور خودکار دستورهای خود را تولید کنند که نیاز به ورودی دستی را کاهش می‌دهد.

توسعه دستورهای چندحالتی

با ظهور مدل‌های هوش مصنوعی چندحالتی که قادر به پردازش متن و تصویر هستند دامنه مهندسی دستورهای به دستورات بصری گسترش یافته است.

پیشنهاد می‌کنیم درباره DALL-E 3 و طرز کار آن هم مطالعه کنید.

توسعه دستورهای اخلاقی

با اهمیت‌یافتن اخلاق هوش مصنوعی، تمرکز روی خلق دستورهایی است که عدالت، شفافیت و کاهش تعصب را تضمین کنند.

پیشنهاد می‌کنیم درباره مهم‌ترین چالش های اخلاقی هوش مصنوعی هم مطالعه کنید.

ارزش و اهمیت بلندمدت

مهندسی دستورها صرفاً یک روند گذرا نیست. با پیچیده‌ترشدن مدل‌های هوش مصنوعی و یکپارچه‌سازی آن‌ها در کاربردهای متنوع از بهداشت و درمان تا سرگرمی نیاز به ارتباطات مؤثر حیاتی می‌شود. مهندسان پرامپت می‌توانند اطمینان حاصل می‌کنند این مدل‌ها دست‌یافتنی، کاربرپسند و مرتبط با زمینه هستند.

علاوه‌براین با دموکراتیک‌شدن هوش مصنوعی و تعامل بیشتر افراد بدون تخصص فنی با این مدل‌ها، نقش مهندس دستور تکامل خواهد یافت. آنان مسئول خلق رابط‌های کاربری شهودی، تدوین دستورهای کاربرپسند و اطمینان از این خواهند بود که هوش مصنوعی ابزاری باشد که توانایی‌های انسانی را افزایش دهد.

چالش‌ها و فرصت‌ها

مانند هر حوزه نوظهوری، مهندسی پرامپت با چالش‌های خاص خود روبه‌رو است:

  • پیچیدگی مدل‌ها: با رشد اندازه و پیچیدگی مدل‌ها، خلق دستورهای مؤثر دشوارتر می‌شود.
  • تعصب و عدالت: اطمینان از اینکه دستورها به‌طور ناخواسته تعصبات را در خروجی‌های مدل معرفی یا تقویت نکنند.
  • همکاری بین‌رشته‌ای: مهندسی دستور در تقاطع زبان‌شناسی، روان‌شناسی و علوم کامپیوتر قرار دارد و همکاری در سراسر رشته‌ها را ضروری می‌کند.

بااین‌حال این چالش‌ها نیز فرصت‌هایی ارائه می‌کنند. آنان نوآوری را تحریک می‌کنند، همکاری بین‌رشته‌ای را تقویت می‌کنند و راه را برای نسل بعدی ابزارها و راه‌حل‌های هوش مصنوعی هموار می‌کنند.

نکته نهایی درباره مهندسی پرامپت

مهندسی پرامپت، گرچه رشته‌ای نسبتاً جدید است، کلید فراهم‌کردن تمامی پتانسیل‌های مدل‌های هوش مصنوعی، به‌ویژه مدل‌های بزرگ زبانی، را در دست دارد. همان‌طور که این مدل‌ها به‌طور فزاینده‌ای در زندگی روزمره ما ادغام می‌شوند، اهمیت ارتباط مؤثر بیش‌ازپیش آشکار می‌شود. چه یک دستیار صوتی که در انجام‌دادن کارهای روزمره کمک می‌کند، یک چت‌بات که پشتیبانی مشتریان را فراهم می‌آورد یا ابزار هوش مصنوعی که به پژوهشگران کمک می‌کند، کیفیت تعامل بر پایه پرسش‌هایی است که آن‌ها را هدایت می‌کند.

برای علاقه‌مندان به داده‌ها، متخصصان و حتی عموم مردم، فهمیدن مهندسی پرامپت فقط درباره بهبود ارتباط با هوش مصنوعی نیست. بلکه درباره تصور آینده‌ای است که در آن هوش مصنوعی به‌طور نامحسوسی در زندگی ما ادغام می‌شود، قابلیت‌های ما را افزایش می‌دهد و تجربه‌های ما را غنی‌سازی می‌کند.

یک مهندس پرامپت چه کاری انجام می‌دهد؟

امروزه هر فرد غیر فنی می‌تواند به ChatGPT مراجعه کند و درخواست خود را مطرح کند. پس چرا به مهندسان پرامپت نیاز داریم؟ خب، مهندسان پرامپت می‌دانند که چگونه از مدل هوش مصنوعی درخواست کنند تا نتایج دقیق را به دست آورند. آن‌ها سوالات مناسبی مطرح می‌کنند و درخواست‌های هدفمندی می‌نویسند تا مدل بهترین نتایج را تولید کند.

تصور کنید نیاز به کد پایتون برای توسعه‌ی یک صفحه ورود دارید، بنابراین ممکن است از GPT بخواهید: «یک کد پایتون برای ایجاد یک صفحه ورود بنویس»، اما فردی که با مفهوم پرامپت آشناست، این درخواست را به این شکل مطرح می‌کند: «مثل یک توسعه‌دهنده پایتون عمل کن و به یک توسعه‌دهنده تازه‌کار نشان بده چگونه یک صفحه ورود با فیلدهای نام کاربری و رمز عبور به همراه دکمه ورود بسازد». این همان اصل مهندسی پرامپت است.

مهندسان پرامپت جنبه‌های فنی زیادی در ارتباط با مدل‌های زبان بزرگ نیز انجام می‌دهند. آن‌ها مدل‌های هوش مصنوعی را با استفاده از پرامپت‌ها آزمایش و بهینه می‌کنند. این فرآیند شامل پیگیری رفتار مدل هوش مصنوعی با تحلیل پاسخ‌های آن به پرامپت‌های مختلف است. سپس الگوها و سوگیری‌ها را جستجو می‌کنند، تست‌های A/B روی داده‌های خروجی اجرا می‌کنند و پرامپت‌ها را برای برطرف کردن محدودیت‌ها اصلاح می‌کنند.

در مجموع، مهندسان پرامپت بازیگران اصلی در بهینه‌سازی کل فرآیند تولید پرامپت‌های هوش مصنوعی برای برنامه‌های سفارشی هستند.

چگونه یک مهندس پرامپت شویم؟

تبدیل شدن به یک مهندس پرامپت یک تصمیم شغلی هوشمندانه است، به‌ویژه که هوش مصنوعی مولد یکی از سریع‌ترین تکنولوژی‌های در حال رشد است و انتظار می‌رود در ده سال آینده، نرخ رشد سالانه مرکب 20 درصد داشته باشد. در اینجا به‌صورت جامع به بررسی چگونگی تبدیل شدن به یک مهندس پرامپت هوش مصنوعی می‌پردازیم.

تسلط بر پایتون

مهندسان پرامپت باید دانش کاملی از برنامه‌نویسی پایتون داشته باشند. آشنایی با کدنویسی پایتون به شما اجازه می‌دهد تا به‌سرعت مدل‌های یادگیری عمیق و پردازش زبان طبیعی را یاد بگیرید.

به‌عنوان یک مهندس پرامپت، ممکن است کل یک مدل زبانی را به‌تنهایی نسازید. اما در برخی از موقعیت‌های پردرآمد مهندسی پرامپت، از شما انتظار می‌رود داده‌های تولید شده توسط مدل‌های زبانی را تحلیل کنید و برای بهبود مدل، به اطلاعات ارزشمندی دست یابید. و زمانی که به داده‌ها می‌پردازید، پایتون بی‌همتاست.

مراحل زیر را برای یادگیری پایتون در مهندسی پرامپت دنبال کنید:

  • یادگیری Syntax
  • آشنایی با کتابخانه‌های NumPy، Pandas، Matplotlib و Scikit-learn
  • کار عملی با کتابخانه‌های NLTK، spaCy، TextBlob و دیگر کتابخانه‌های پردازش زبان طبیعی
  • تمرین تحلیل داده
  • یادگیری مدل‌های یادگیری ماشین
  • تمرین کدنویسی پایتون

درک اصول اولیه هوش مصنوعی

سفر حرفه‌ای خود را با آشنایی با فناوری‌ای که قرار است از آن استفاده کنید، آغاز کنید. در این مورد، ابتدا باید بفهمید هوش مصنوعی چیست و سپس به زیرشاخه‌های آن بپردازید. ایده اساسی پشت هوش مصنوعی (AI) بسیار جذاب است. ساختن ماشین‌هایی که به‌صورت هوشمندانه و مشابه انسان‌ها رفتار کنند تا وظایف خاصی را انجام دهند.

یادگیری ماشین، پردازش زبان طبیعی، علم داده، یادگیری عمیق و بسیاری از زیرشاخه‌های دیگر بخشی از این حوزه بزرگ هوش مصنوعی هستند. ابتدا یک نمای کلی از هر یک از این فناوری‌ها داشته باشید و تفاوت‌های آن‌ها را بشناسید.

مدل‌های زبانی بزرگ رابطه بسیار محکمی با یادگیری عمیق و پردازش زبان طبیعی دارند. اگرچه همه مهندسان پرامپت از ابتدا یک مدل هوش مصنوعی را نمی‌سازند، انتظار می‌رود مهارت‌های قوی در پردازش زبان طبیعی و یادگیری عمیق داشته باشند تا مدل زبانی‌ای که با آن کار می‌کنند را به‌خوبی درک کنند.

یادگیری پردازش زبان طبیعی (NLP)

پردازش زبان طبیعی یکی از داغ‌ترین موضوعات در حال حاضر در هوش مصنوعی است. این فناوری به کامپیوترها اجازه می‌دهد زبان‌ انسان را بخوانند و تفسیر کنند. حتی بیشتر از این، به ماشین‌ها امکان می‌دهد پاسخ‌هایی شبیه به انسان در زبان طبیعی ایجاد کنند.

علاوه بر این، پردازش زبان طبیعی به شما کمک می‌کند پرامپت‌های مناسبی طراحی کنید که بتواند یک مدل هوش مصنوعی را برای ایجاد خروجی‌های هدف‌مند شکل دهد. بنابراین، به‌عنوان یک مهندس پرامپت، پردازش زبان طبیعی چیزی است که باید در آن مهارت داشته باشید. کتابخانه‌هایی مانند NLTK، spaCy و Transformers را بررسی کنید تا برای پردازش داده‌های زبانی آماده شوید.

می‌توانید با تسلط بر پردازش متن ابتدایی شروع کنید و به عمق تکنیک‌هایی مانند توکن کردن، تحلیل احساسات و خلاصه‌سازی متن بروید.

پیشنهاد می‌کنیم درباره پردازش زبان طبیعی (Natural Language Processing) هم مطالعه کنید.

یادگیری یادگیری عمیق و مدل‌های ترانسفورمر

در مسیر تبدیل شدن به یک مهندس پرامپت، اغلب با مدل‌های بزرگ زبانی مانند GPT، Gemini، LLaMA و موارد دیگر روبرو خواهید شد. این مدل‌های زبانی بزرگ چیزی جز مدل‌های یادگیری عمیق مقیاس‌پذیر که برای درک و تولید زبان طبیعی طراحی شده‌اند، نیستند. برای مدیریت موثر آنها، باید مفاهیم یادگیری عمیق را به خوبی درک کنید.

به عنوان مثال، ChatGPT با بیش از ۱۷۵ میلیارد نورون تغذیه می‌شود. برای درک نورون‌ها و نحوه تغذیه آنها، ابتدا باید با مفهوم شبکه‌های عصبی که ستون فقرات بسیاری از الگوریتم‌های یادگیری عمیق هستند، آشنا شوید.

احتمالاً می‌دانید که «T» در GPT به معنای Transformer است. مدل‌های بزرگ زبانی محبوب مانند ChatGPT بر پایه معماری ترانسفورمر ساخته شده‌اند.

معماری‌های ترانسفورمر از چیزی به نام مکانیسم توجه استفاده می‌کنند، که تکنیکی برای بهبود دقت مدل با تمرکز فقط بر بخش‌های مرتبط از داده‌های ورودی است. مطالعه این معماری‌ها به شما کمک می‌کند پرامپت‌های موثرتری ایجاد کنید.

پیشنهاد می‌کنیم درباره معماری ترنسفورمر و مکانیزم توجه هم مطالعه کنید.

کار عملی با مدل‌های پیش‌آموزش‌دیده

مهندسان پرامپت بخش قابل‌توجهی از وقت خود را صرف کار با مدل‌های پیش‌آموزش‌دیده (Pre-trained) می‌کنند. در صورتی که با این مدل‌ها آشنا نیستید، مدل‌های پیش‌آموزش‌دیده همان مدل‌های پایه هوش مصنوعی هستند که بر روی حجم زیادی از داده‌ها به طور گسترده آموزش داده شده‌اند. این اولین گام در ساخت هر مدل بزرگ زبانی است.

اگر واقعاً می‌خواهید در مهندسی پرامپت مهارت پیدا کنید، با مدل‌های پیش‌آموزش‌دیده موجود مانند GPT-2، GPT-3، BERT و غیره آشنا شوید. پرامپت‌های مختلف را وارد کنید و نحوه واکنش آنها را مطالعه کنید. قابلیت‌های تولید متن آنها را درک کنید و محدودیت‌ها را شناسایی کنید.

علاوه بر این، پارامترهایی که این مدل‌ها بر اساس آنها آموزش داده شده‌اند را درک کنید. گاهی اوقات نیاز دارید که هایپرپارامترهای آنها را برای دستیابی به نتایج خاص تنظیم کنید.

آیا با مرجع مدل‌های پیش‌آموزش‌دیده آشنایی دارید؟ پیشنهاد می‌کنیم درباره پلتفرم Hugging Face هم مطالعه کنید.

تنظیم دقیق (Fine-tuning) برای برنامه‌های سفارشی

تنها تعداد کمی از شرکت‌ها توانایی آموزش مدل‌های زبانی بزرگ را از ابتدا دارند. به همین دلیل است که دیگران شما را به عنوان یک مهندس پرامپت (Prompt Engineer) دعوت می‌کنند تا مدل‌های از پیش آموزش‌دیده را برای برنامه‌های سفارشی خود تنظیم دقیق کنید.

به عنوان مثال، یک مدل از پیش آموزش‌دیده ممکن است نتواند یک فایل HTML را مطابق با نیازهای طراحی شما تولید کند، اما شما می‌توانید با تنظیم دقیق آن بر روی مجموعه داده‌های مرتبط با رابط کاربری و HTML، به خروجی‌های مطلوب برسید.

به طور کلی، یک مهندس پرامپت باید بتواند هر مدل از پیش آموزش‌دیده‌ای را برای وظایف خاص تنظیم دقیق کند. این کار با تغذیه مدل‌های از پیش آموزش‌دیده با مجموعه داده‌های کوچک و مشخص انجام می‌شود.

پیش‌پردازش داده‌ها، تنظیم هایپرپارامترها و یادگیری انتقالی از مهارت‌های ضروری برای تنظیم دقیق یک مدل از پیش آموزش‌دیده هستند. به خاطر داشته باشید که عمق این مهارت‌های فنی بسته به نیازهای موقعیتی که برای آن درخواست می‌دهید، متفاوت است.

به طور معمول، برای نقش‌های ابتدایی، مفاهیم NLP و توانایی ساخت پرامپت‌های هوشمند برای ورود به این حوزه کافی هستند. با این حال، یک موقعیت سطح ارشد یا با درآمد بالا ممکن است به تجربه عملی عمیق‌تری با کتابخانه‌های NLP، الگوریتم‌های یادگیری عمیق و تکنیک‌های پرامپت پیشرفته نیاز داشته باشد.

تسلط بر هنر ساخت پرامپت

مدل‌های زبان، بر اساس ورودی‌هایی که به آنها می‌دهید، خروجی تولید می‌کنند. اگر بتوانید به مدل هوش مصنوعی دقیقا توضیح دهید که چه می‌خواهید و آن را برای تولید نتایج دلخواه تنظیم کنید، می‌توانید خودتان را یک مهندس پرامپت بنامید.

نوشتن پرامپت‌های واضح و بهبود پرامپت‌های موجود، دو کار اصلی مهندسان پرامپت است. آنها باید سوالات و جملاتی را طراحی کنند که بتواند مدل هوش مصنوعی را به سمت پاسخ‌های مرتبط هدایت کند.

برای این منظور، باید در نویسندگی مهارت داشته باشید، و یک نکته برای نوشتن پرامپت‌های بهتر این است که زمینه و دستورالعمل‌ها را در آنها بگنجانید. با این حال، برای رسیدن به مهارت کامل در مهندسی پرامپت، لازم است برخی تکنیک‌های پیشرفته مهندسی پرامپت را بیاموزید.

تکنیک‌های پیشرفته پرامپت‌نویسی

قبلاً به شما پیشنهاد کرده‌ایم که با مدل‌های از پیش آموزش‌دیده کار کنید و این نکته‌ای است که تکرار آن خالی از لطف نیست. از DALL-E، GPT-2، GPT-3 یا BERT برای تمرین تکنیک‌های مختلف پرامپت‌نویسی و مشاهده عملکرد آنها استفاده کنید.

استراتژی‌های مختلفی برای پرامپت‌نویسی وجود دارد مانند پرامپت‌نویسی بدون مثال (Zero-shot prompting)، پرامپت‌نویسی تک مثال (One-shot prompting)، پرامپت‌نویسی تکرارشونده و بسیاری دیگر. می‌توانید با یادگیری و تمرین این تکنیک‌ها، به یک مهندس پرامپت برجسته تبدیل شوید.

پروژه‌های دنیای واقعی و ساخت پورتفولیو

با درک دقیق از فناوری هوش مصنوعی و مهارت‌های ذکر شده، می‌توانید تخصص جدید خود را در پروژه‌های دنیای واقعی به کار بگیرید. چه یک حرفه‌ای شاغل باشید و چه دانشجوی دانشگاه، برای پروژه‌هایی که به مهندسی درخواست نیاز دارند، داوطلب شوید.

اگر پروژه شما از یک مدل از پیش آموزش‌دیده استفاده می‌کند، درک فنی از نحوه ساخت آن و رفتارهایش داشته باشید. روش‌های مختلفی را برای درخواست از مدل امتحان کنید و ببینید چگونه پاسخ می‌دهد. از تکنیک‌های پیشرفته درخواست‌گذاری که آموخته‌اید استفاده کنید تا مدل را فعال کنید. به این ترتیب، می‌توانید نظریه را به مهارت تبدیل کنید.

در ادامه، می‌توانید در مسابقات مرتبط با هوش مصنوعی محاوره‌ای و مدل‌های زبانی بزرگ در پلتفرم‌هایی مانند Kaggle شرکت کنید تا جایگاه خود را در بین همتایان خود بسنجید. به یاد داشته باشید، هر چیزی که در این مرحله انجام می‌دهید می‌تواند در پورتفولیوی شما قرار گیرد و پروفایل شما را حتی قوی‌تر کند.

به یادگیری ادامه دهید و با جامعه هوش مصنوعی تعامل کنید

دوره‌های آنلاین بگذرانید؛ دوره‌های زیادی درباره مهندسی درخواست اخیراً ایجاد شده است. دوره‌های مدرک‌‌دار نه تنها به شما کمک می‌کنند مهارت‌ها را کسب کنید، بلکه به پروفایل شما اضافه می‌کنند که واقعاً این فناوری را آموخته‌اید.

به‌روز بودن با آخرین روندها، به‌ویژه در فناوری‌های در حال رشد مانند Sora از OpenAI ضروری است. هیچ راهی بهتر از تعامل با جامعه مناسب برای به‌روز ماندن وجود ندارد. برای این کار، محققان و توسعه‌دهندگان برتر مهندسی درخواست را در سایت‌هایی مانند لینکدین، مدیوم و توییتر دنبال کنید.

بهترین پرامپت‌های هوش مصنوعی برای هر کاری!

Prompt Library یک کتابخانه پرامپت آماده است که توسط Anthropic ارائه شده است تا به کاربران در بهینه‌سازی و بهبود تجربه کار با Claude کمک کند. این کتابخانه شامل نمونه پرامپت‌ها برای کاربردهای مختلف است که کاربران می‌توانند مستقیماً از آن‌ها استفاده کنند یا متناسب با نیازهای خود شخصی‌سازی کنند.

Claude یک مدل زبان بزرگ (LLM) است که توسط Anthropic توسعه داده شده و به صورت مشابه با ChatGPT از OpenAI عمل می‌کند. این مدل برای پاسخ‌گویی به سوالات، نوشتن محتوا، کدنویسی و تسهیل کارهای مختلف استفاده می‌شود.

مزایای استفاده از کتابخانه پرامپت:

  • تسهیل دسترسی: کاربران می‌توانند به سرعت به پرامپت‌های کاربردی دسترسی پیدا کنند.
  • صرفه‌جویی در زمان: نیاز به طراحی و نوشتن پرامپت‌های جدید از ابتدا کاهش می‌یابد.
  • قابلیت سفارشی‌سازی: پرامپت‌ها را می‌توان به راحتی تغییر داد تا با نیازهای خاص کاربران سازگار شود.

پیاده‌سازی پرامپت‌های Prompt Library

پرامپت‌های موجود در این کتابخانه را می‌توان در محیط‌های مختلفی اجرا کرد. Anthropic Console اولین پیشنهاد برای پیاده‌سازی این پرامپت‌ها است، اما ایجاد حساب کاربری در آن نیاز به شماره‌ای غیر از شماره ایران دارد که ممکن است مشکلاتی ایجاد کند. به همین دلیل، من ChatGPT Playground را انتخاب کردم که علاوه بر داشتن ساختاری مشابه، دسترسی آسان‌تری نیز ارائه می‌دهد.

ChatGPT Playground چیست و چه تفاوتی با ChatGPT دارد؟

ChatGPT Playground یک ابزار آنلاین است که توسط OpenAI ارائه شده و به کاربران اجازه می‌دهد با مدل‌های مختلف GPT (مانند GPT-3 و GPT-4) به صورت تعاملی کار کنند. در این محیط می‌توانید به راحتی پرامپت‌های مختلف را آزمایش کنید، تنظیمات مدل را تغییر دهید و خروجی‌ها را بررسی کنید.

ویژگی‌ها

  • کنترل‌های پیشرفته: امکان تنظیم پارامترهای مختلف مانند Temperature، طول پاسخ (Maximum Length)، Top P، پرامپت سیستم (System Prompt)، و پرامپت کاربر (User Prompt).
  • انتخاب مدل: انتخاب بین مدل‌های مختلف مانند GPT-3.5، GPT-4، و GPT-4 Turbo.
  • امکان تست پرامپت‌ها: کاربران می‌توانند پرامپت‌های خود را تست کرده و خروجی‌ها را برای بهبود پرامپت‌ها بررسی کنند.
  • نمایش کد: قابلیت مشاهده کد درخواست‌ها و پاسخ‌های انجام شده برای اهداف برنامه‌نویسی.

کاربردها

  • آزمایش و بهینه‌سازی پرامپت‌ها: برای پژوهشگران و توسعه‌دهندگان، مناسب برای آزمایش پرامپت‌های مختلف و بهینه‌سازی آن‌ها.
  • یادگیری مهندسی پرامپت: مناسب برای یادگیری و تمرین پرامپت‌نویسی.
  • یکپارچه‌سازی با پروژه‌ها: توسعه‌دهندگان می‌توانند از این محیط برای توسعه برنامه‌های خود استفاده کنند.

تفاوت‌ها با ChatGPT

  • رابط کاربری و هدف: ChatGPT Playground دارای رابط کاربری پیچیده‌تر با گزینه‌های پیشرفته برای کنترل مدل است و هدف آن ارائه خدمات به کاربران حرفه‌ای، توسعه‌دهندگان و محققان است. دسترسی به این محیط نیاز به کلید API دارد و معمولاً از طریق OpenAI API در دسترس است. از سوی دیگر، ChatGPT با رابط کاربری ساده و کاربرپسند، بیشتر بر استفاده عمومی تمرکز دارد. این سرویس برای استفاده روزمره توسط عموم مردم مناسب است و دسترسی به آن به‌صورت مستقیم از طریق chat.openai.com بدون نیاز به API امکان‌پذیر است.
  • تنظیمات و مدل‌ها: ChatGPT Playground امکان تنظیم دقیق پارامترها را به کاربران می‌دهد و می‌توانند از میان چندین مدل مختلف انتخاب کنند. در مقابل، ChatGPT تنظیمات محدودتری دارد و به یک رابط کاربری ساده بسنده می‌کند، اما دسترسی به مدل‌های GPT-3.5 و GPT-4 را بسته به پلن کاربر فراهم می‌سازد.
  • قابلیت‌های دیگر: ChatGPT Playground امکان ذخیره و اشتراک‌گذاری پرامپت‌ها و نتایج را فراهم کرده و کاربران می‌توانند کد درخواست‌های API را نیز مشاهده کنند. از سوی دیگر، ChatGPT بیشتر بر مکالمات تعاملی تمرکز دارد و تنظیمات و گزینه‌های پیشرفته را ارائه نمی‌دهد.

ChatGPT Playground یک محیط پیشرفته‌تر برای آزمایش و بهینه‌سازی پرامپت‌ها با استفاده از مدل‌های GPT است، در حالی که ChatGPT برای استفاده عمومی و تعامل روزمره طراحی شده است.

ChatGPT Playground به طور کلی رایگان نیست، اما با اعتبار رایگان اولیه می‌توان تا حدی از آن استفاده کرد و برای استفاده طولانی‌مدت، نیاز به پرداخت هزینه‌ها بر اساس توکن‌های مصرف‌شده وجود دارد.

System Prompt و User Prompt به چه معنی هستند؟

در پلتفرم‌هایی مانند ChatGPT Playground و Anthropic Console دو قسمت برای وارد کردن پرامپت‌ها وجود دارد System Prompt و User Prompt. هر کدام از این بخش‌ها وظایف خاصی دارند که در ادامه توضیح داده می‌شود.

System Prompt

System Prompt بخشی است که تنظیمات کلی، رفتار مدل، تنظیم سبک و لحن پاسخ‌ها را مشخص می‌کند. پیام‌هایی که در این بخش وارد می‌شوند به عنوان دستورالعمل‌های کلی به مدل داده می‌شوند و تعیین می‌کنند که مدل به طور کلی چگونه عمل کند. به عنوان مثال، پیامی مانند “You are a helpful assistant” (شما یک دستیار مفید هستید) به مدل اعلام می‌کند که باید به گونه‌ای مفید و کارآمد پاسخ دهد.

User Prompt

User Prompt بخشی است که شامل پیام‌های ورودی مستقیم کاربران می‌شود. این پیام‌ها سوالات یا دستورات مشخصی هستند که کاربران انتظار دارند مدل به آن‌ها پاسخ دهد. به عنوان مثال، “Write a blog post about prompt engineering” (یک پست وبلاگ درباره مهندسی پرامپت بنویس).

نکات مهم در مورد System Prompt و User Prompt

System Prompt نباید خیلی طولانی باشد، بلکه فقط باید چارچوب کلی رفتار مدل را مشخص کند. همچنین User Prompt باید واضح و مشخص باشد تا مدل بتواند به درستی پاسخ دهد. این پرامپت‌ها به مدل کمک می‌کنند تا پاسخ‌های دقیق، کاربردی و مرتبط ارائه دهد.

نتیجه‌گیری

اکنون بهترین زمان برای شروع با هوش مصنوعی مولد است. دنیای شرکت‌های فناوری بیشتر از همیشه به دنبال مهندسان درخواست است تا هوش مصنوعی محاوره‌ای را در کسب‌وکار خود پیاده‌سازی کنند.

مسیر تبدیل شدن به یک مهندس پرامپت ارزشمند و هیجان‌انگیز است. هر کسی می‌تواند با ترکیب مناسبی از مهارت‌های فنی و غیر فنی که در این مقاله ذکر شده، به یک مهندس پرامپت تبدیل شود.

پرسش‌های متداول

دستورعمل یا پرامپت (Prompt) در زمینه هوش مصنوعی دقیقاً به چه معناست؟

دستورعمل یا پرامپت سوال یا دستوری است که به مدل هوش مصنوعی، به‌ویژه مدل‌های بزرگ زبانی (LLM)، داده می‌شود تا پاسخ خاصی را برانگیزاند. این دستورعمل‌ها به‌عنوان رابط میان نیت انسان و خروجی ماشین عمل می‌کنند.

چرا مهندسی دستورعمل مهم است؟

مهندسی دستورعمل اطمینان می‌دهد که مدل‌های هوش مصنوعی خروجی‌های دقیق و مرتبط تولید کنند. این حرفه هنر طراحی دستورعمل‌های مؤثری است که رفتار مدل را هدایت می‌کند و ارتباط مؤثر میان انسان و هوش مصنوعی را تضمین می‌کند.

آیا برای درک مهندسی دستورعمل به پیش‌زمینه‌ای در هوش مصنوعی یا یادگیری ماشین نیاز دارم؟

اگرچه داشتن پیش‌زمینه‌ای در هوش مصنوعی می‌تواند مفید باشد، ضروری نیست. مهندسی دستورعمل به‌اندازه مهارت‌های فنی، درباره زبان و ارتباطات است. با دسترسی به منابع مناسب و یادگیری، هر کسی می‌تواند مفاهیم اولیه آن را درک کند.

مهندسی دستورعمل چگونه به چت‌بات‌ها و دستیارهای صوتی مرتبط است؟

چت‌بات‌ها و دستیارهای صوتی به‌شدت به دستورعمل‌ها وابسته‌اند. سؤالات یا دستورهایی که شما می‌پرسید یا می‌دهید، درواقع، دستورعمل‌هایی هستند. مهندسی دستورعمل مؤثر اطمینان می‌دهد که این ابزارها درک می‌کنند و به درخواست‌های کاربران به‌درستی پاسخ می‌دهند.

آیا خطراتی هم در مهندسی دستورعمل وجود دارد؟

مانند هر روش دیگری در هوش مصنوعی، مهندسی دستورعمل نیز ممکن است چالش‌هایی داشته باشد. دستورعمل‌های دارای تعصب یا طراحی نامناسب می‌توانند به خروجی‌های نادرست یا تعصب‌آمیز بینجامند. بسیار مهم است که با دقت و درنظر‌گرفتن عدالت و شفافیت به مهندسی دستورعمل نگاه کنیم.

یادگیری دیتا ساینس را از امروز شروع کنید!

دنیای داده‌ها جذاب است و دانستن علم داده، توانایی تحلیل داده‌ یا بازاریابی مبتنی بر داده شما را برای فرصت‌های شغلی بسیاری مناسب می‌کند. فارغ از رشته‌ و پیش‌زمینه‌، می‌توانید یادگیری این دانش را همین امروز شروع کنید و آن را از سطح مقدماتی تا پیشرفته بیاموزید. اگر دوست دارید به این حوزه وارد شوید، پیشنهاد می‌کنیم با کلیک روی این لینک قدم اول را همین حالا بردارید.

مشاوران کافه‌تدریس به شما کمک می‌کنند مسیر یادگیری برای ورود به این حوزه را شروع کنید:

دوره جامع دیتا ساینس و ماشین لرنینگ