AI አንዳንድ ጊዜ እንደ ምትሃታዊ ዘዴ ነው የሚመስለው። የዘፈቀደ ጥያቄን ተይብበሃል፣ እና bam - ለስላሳ፣ የተጣራ መልስ በሰከንዶች ውስጥ ይታያል። ግን እዚህ ከርቭቦል ነው፡ ከእያንዳንዱ “ሊቅ” ማሽን ጀርባ፣ እግረ መንገዳቸውን እየነቀነቁ፣ እያረሙ እና እየቀረጹት ያሉ ሰዎች አሉ። AI አሰልጣኞች ተብለው ይጠራሉ ፣ እና የሚሰሩት ስራ እንግዳ፣ አስቂኝ እና ብዙ ሰዎች ከሚያስቡት በላይ በታማኝነት የበለጠ ሰው ነው።
እነዚህ አሰልጣኞች ለምን አስፈላጊ እንደሆኑ፣ የእለት ተእለት ህይወታቸው በትክክል ምን እንደሚመስል እና ለምን ይህ ሚና ማንም ከተነበየው በበለጠ ፍጥነት እንደሚነፍስ እንመርምር።
ከዚህ በኋላ ሊያነቧቸው የሚፈልጓቸው መጣጥፎች፡-
🔗 AI arbitrage ምንድን ነው፡ ከ buzzword በስተጀርባ ያለው እውነት
AI የግልግል ዳኝነትን፣ ጉዳቶቹን፣ ጥቅሞቹን እና የተለመዱ የተሳሳቱ አመለካከቶችን ያብራራል።
🔗 ለ AI የውሂብ ማከማቻ መስፈርቶች፡ ማወቅ ያለብህ ነገር
ለኤአይአይ ሲስተሞች የማከማቻ ፍላጎቶችን፣ መስፋፋትን እና ቅልጥፍናን ይሸፍናል።
🔗 የ AI አባት ማን ነው?
የ AI አቅኚዎችን እና የአርቴፊሻል ኢንተለጀንስ አመጣጥን ይመረምራል።
ጠንካራ AI አሰልጣኝ የሚያደርገው ምንድን ነው? 🏆
የአዝራር መፍቻ ስራ አይደለም። በጣም ጥሩዎቹ አሰልጣኞች በሚያስደንቅ የችሎታ ድብልቅ ላይ ይደገፋሉ፡-
-
ትዕግስት (ብዙ) - ሞዴሎች በአንድ ምት አይማሩም. አሰልጣኞች እስኪጣበቅ ድረስ ተመሳሳይ እርማቶችን መዶሻቸውን ይቀጥላሉ.
-
ንቀትን ማጉላት - ስላቅ፣ ባህላዊ አውድ ወይም አድሎአዊነት የሰውን አስተያየት ዳር ዳር የሚሰጠው ነው [1]።
-
ቀጥተኛ ግንኙነት - ግማሹ ሥራው AI ሊሳሳት የማይችል ግልጽ መመሪያዎችን መጻፍ ነው።
-
የማወቅ ጉጉት + ስነምግባር - ጥሩ አሰልጣኝ መልሱ “በእውነቱ ትክክል ነው” ነገር ግን በማህበራዊ ደረጃ መስማት የተሳናቸው - በ AI ቁጥጥር ውስጥ ዋና ጭብጥ ነው ብሎ ይጠይቃል።
በቀላል አነጋገር፡ አሠልጣኝ ከፊል መምህር፣ ከፊል አርታዒ እና የሥነ-ምግባር ባለሙያ ነው።
የ AI አሰልጣኝ ሚናዎች በጨረፍታ (ከአንዳንድ ቃላቶች ጋር 😉)
| የሚና አይነት | ማን ነው የሚስማማው። | የተለመደ ክፍያ | ለምን ይሰራል (ወይም አይሰራም) |
|---|---|---|---|
| የውሂብ መለያ ሰሪ | ጥሩ ዝርዝሮችን የሚወዱ ሰዎች | ዝቅተኛ-መካከለኛ $$ | ፍጹም ወሳኝ; መለያዎቹ ዝግ ከሆኑ፣ ሞዴሉ በሙሉ ይሠቃያል [3] 📊 |
| RLHF ስፔሻሊስት | ጸሃፊዎች፣ አዘጋጆች፣ ተንታኞች | መካከለኛ - ከፍተኛ $$ | ቃና እና ግልጽነት ከሰዎች ከሚጠበቀው ጋር ለማጣጣም ምላሾችን ደረጃ ሰጥቶ ይጽፋል [1] |
| የጎራ አሰልጣኝ | ጠበቆች, ዶክተሮች, ባለሙያዎች | በካርታው ላይ በሙሉ 💼 | ለኢንዱስትሪ-ተኮር ስርዓቶች የኒች jargon እና የጠርዝ ጉዳዮችን ይቆጣጠራል |
| የደህንነት ገምጋሚ | ስነምግባር ያላቸው ሰዎች | መካከለኛ $$ | AI ጎጂ ይዘትን እንዲያስወግድ መመሪያዎችን ይተገበራል [2][5] |
| የፈጠራ አሰልጣኝ | አርቲስቶች ፣ ተረት ሰሪዎች | የማይታወቅ 💡 | በአስተማማኝ ገደቦች ውስጥ በሚቆዩበት ጊዜ AI ማሚቶ ምናብን ይረዳል [5] |
(አዎ፣ ቅርጸቱ ትንሽ የተመሰቃቀለ ነው - ልክ እንደ ስራው ነው።)
በ AI አሰልጣኝ ህይወት ውስጥ ያለ ቀን
ታዲያ ትክክለኛው ስራ ምን ይመስላል? ያነሰ ማራኪ ኮድ እና ተጨማሪ ያስቡ፡
-
በ AI የተፃፉ መልሶችን ከክፉ ወደ ምርጥ ደረጃ መስጠት (የተለመደ የRLHF ደረጃ) [1]።
-
ድብልቆችን ማስተካከል (እንደ ሞዴሉ ቬነስ ማርስ አይደለችም ሲረሳው).
-
ቻትቦትን እንደገና መፃፍ የበለጠ ተፈጥሯዊ እንዲመስል ይመልሳል።
-
የጽሑፍ፣ የምስሎች ወይም የድምጽ ተራሮችን መሰየም - ትክክለኛነት በጣም አስፈላጊ በሆነበት [3]።
-
"በቴክኒካል ትክክል" በቂ እንደሆነ ወይም የደህንነት መመሪያዎች መሻር ካለባቸው መወያየት [2]።
ከፊል መፍጨት፣ ከፊል እንቆቅልሽ ነው። በሐቀኝነት፣ በቀቀን ለመናገር ብቻ ሳይሆን ቃላትን በመጠኑ ስህተት መጠቀሙን እንዲያቆም ለማስተማር ያስቡ - መንቀጥቀጥ ነው። 🦜
ለምን አሰልጣኞች እርስዎ ከሚያስቡት በላይ አስፈላጊ ናቸው።
ሰዎች ሳይመሩ፣ AI የሚከተለውን ያደርጋል፡-
-
ጠንካራ ድምጽ እና ሮቦት።
-
ያልተረጋገጠ አድልዎ (አስፈሪ ሀሳብ) ያሰራጩ።
-
ቀልድ ወይም ርህራሄን ሙሉ በሙሉ አምልጦታል።
-
ሚስጥራዊነት ባላቸው አውዶች ውስጥ ትንሽ ደህንነታቸው የተጠበቀ ይሁኑ።
አሰልጣኞች “የተዝረከረከ የሰው ነገር” ውስጥ ሾልከው የሚገቡ ናቸው - ንግግሮች፣ ሙቀት፣ አልፎ አልፎ ተንኮለኛ ዘይቤ - ነገሮችን ደህንነታቸውን ለመጠበቅ የጥበቃ መንገዶችን ሲተገበሩ [2][5]።
በእውነቱ ሊቆጠሩ የሚችሉ ችሎታዎች
ፒኤችዲ ያስፈልግሃል የሚለውን ተረት እርሳ። በጣም የሚረዳው፡-
-
መፃፍ + አርትዖት ቾፕስ - የተወለወለ ግን ተፈጥሯዊ ድምጽ ያለው ጽሑፍ [1]።
-
የትንታኔ አስተሳሰብ - ተደጋጋሚ የሞዴል ስህተቶችን እና ማስተካከል።
-
የባህል ግንዛቤ - ሐረጎችን መቼ እንደሆነ ማወቅ ስህተት ሊሆን ይችላል [2].
-
ትዕግስት - ምክንያቱም AI ወዲያውኑ አይይዝም.
የጉርሻ ነጥቦች ለብዙ ቋንቋ ችሎታዎች ወይም ጥሩ ችሎታ።
አሰልጣኞች የት እየታዩ ነው 🌍
ይህ ሥራ ስለ ቻትቦቶች ብቻ አይደለም - በየዘርፉ ሾልኮ እየገባ ነው።
-
የጤና እንክብካቤ - ለድንበር ጉዳዮች የማብራሪያ ደንቦችን መጻፍ (በጤና AI መመሪያ ውስጥ የተስተዋለ) [2]።
-
ፋይናንስ - ሰዎችን በውሸት ማንቂያዎች ውስጥ ሳይሰጥሙ ማጭበርበርን የማወቅ ዘዴዎችን ማሰልጠን [2]።
-
ችርቻሮ - ከብራንድ ቃና (ብራንድ) ቃና (ብራንድ) ቃና (ብራንድ) ቃና ጋር በሚጣበቁበት ጊዜ ረዳቶች ተንኮለኛ ሸማች lingo እንዲያገኙ ማስተማር።
-
ትምህርት - አጋዥ ከመሆን ይልቅ የማበረታቻ ቦቶችን መቅረጽ [5]።
በመሠረቱ: AI በጠረጴዛው ላይ መቀመጫ ካለው, ከበስተጀርባ የሚደበቅ አሰልጣኝ አለ.
የስነምግባር ቢት (ይህን መዝለል አይቻልም)
ክብደቱ የሚበዛበት እዚህ ነው። ቁጥጥር ካልተደረገበት፣ AI የተዛባ አመለካከትን፣ የተሳሳተ መረጃን ወይም የከፋን ይደግማል። አሠልጣኞች ያንን ያቆማሉ እንደ RLHF ወይም ሞዴሎችን ወደ አጋዥ፣ ምንም ጉዳት የሌላቸው መልሶች የሚመሩ ሕገ መንግሥታዊ ሕጎችን በመጠቀም [1][5]።
ምሳሌ፡ አንድ ቦት አድሏዊ የስራ ምክሮችን ከገፋ፣ አሠልጣኙ ባንዲራውን ጠቁሞ፣ የመመሪያውን መጽሐፍ እንደገና ይጽፋል እና እንደገና እንዳይከሰት ያደርጋል። ያ በድርጊት ላይ ያለ ቁጥጥር ነው [2]።
በጣም አዝናኝ ያልሆነው ጎን
ሁሉም የሚያብረቀርቅ አይደለም። አሰልጣኞች ከ:
-
ሞኖቶኒ - ማለቂያ የሌለው ስያሜ ያረጀዋል።
-
ስሜታዊ ድካም - ጎጂ ወይም የሚረብሽ ይዘትን መገምገም ከፍተኛ ጉዳት ሊያስከትል ይችላል; የድጋፍ ሥርዓቶች ወሳኝ ናቸው [4].
-
እውቅና ማጣት - ተጠቃሚዎች አሠልጣኞች እንዳሉ አይገነዘቡም።
-
የማያቋርጥ ለውጥ - መሳሪያዎች ያለማቋረጥ ይሻሻላሉ፣ ይህ ማለት አሰልጣኞች መቀጠል አለባቸው።
አሁንም ለብዙዎች የቴክኖሎጂውን "አንጎሎች" የመቅረጽ ደስታ እነርሱን ያቆያል.
የ AI የተደበቁ MVPs
ታዲያ የ AI አሰልጣኞች እነማን ናቸው? ለሰዎች በሚሰሩ ስርዓቶች መካከል ያለው ድልድይ ናቸው ያለ እነርሱ፣ AI ምንም የቤተ-መጻህፍት ባለሙያዎች እንደሌለው ቤተ-መጽሐፍት ይሆናል - ብዙ መረጃ ፣ ግን ለመጠቀም ፈጽሞ የማይቻል ነው።
በሚቀጥለው ጊዜ ቻትቦት ሲስቅህ ወይም በሚገርም ሁኔታ “በድምፅ” ሲሰማህ አሰልጣኙን አመሰግናለሁ። ማሽኖችን ማስላት ብቻ ሳይሆን ማገናኘት የቻሉት ጸጥ ያሉ ምስሎች ናቸው።
ዋቢዎች
[1] Ouyang, L. et al. (2022) የቋንቋ ሞዴሎችን በሰዎች አስተያየት (InstructGPT) መመሪያዎችን እንዲከተሉ ማሰልጠን. NeurIPS አገናኝ
[2] NIST (2023)። አርቲፊሻል ኢንተለጀንስ ስጋት አስተዳደር ማዕቀፍ (AI RMF 1.0)። አገናኝ
[3] Northcutt, C. et al. (2021) በሙከራ ስብስቦች ውስጥ ያሉ የተንሰራፋ መለያ ስህተቶች የማሽን መማሪያ መለኪያዎችን ያበላሻሉ። NeurIPS የውሂብ ስብስቦች እና ማመሳከሪያዎች። አገናኝ
[4] WHO/ILO (2022)። በሥራ ላይ የአእምሮ ጤና መመሪያዎች. አገናኝ
[5] Bai, Y. et al. (2022) ሕገ መንግሥታዊ AI፡ ከኤአይ ግብረ መልስ ጉዳት አልባነት። arXiv. አገናኝ