የ AI መረጃ ከየት ያገኛል?

የአይቲ መረጃውን ከየት ነው የሚያገኘው?

ጭንቅላትህን እያቧጨርክ ተቀምጠህ ታውቃለህ፣ ለምሳሌ… ይህ ነገር በእርግጥ ከየት ነው የመጣው ? ማለቴ፣ AI አቧራማ በሆኑ የቤተ-መጻሕፍት ክምችቶች ውስጥ እየተዘዋወረ ወይም በተንኮል የYouTube ቁምጣዎችን እየጨፈረ አይደለም። ሆኖም ግን በሆነ መንገድ ለሁሉም ነገር መልስ ይሰጣል - ከላዛኛ ብልሃቶች እስከ ጥቁር ቀዳዳ ፊዚክስ - ልክ እንደ ውስጡ ማለቂያ የሌለው የፋይል ካቢኔት አለው። እውነታው የበለጠ እንግዳ ነው፣ እና ምናልባት ከምትገምተው በላይ አስደሳች ሊሆን ይችላል። ትንሽ እንግለጠው (እና አዎ፣ ምናልባት በመንገድ ላይ ጥቂት አፈ ታሪኮችን እንሰብር)።


አስማት ነው? 🌐

አስማት አይደለም፣ ምንም እንኳን አንዳንድ ጊዜ እንደዚያ ይሰማዋል። በኮፍያ ስር የሚሆነው ነገር በመሠረቱ የንድፍ ትንበያ ። ትላልቅ የቋንቋ ሞዴሎች (LLMs) እውነታዎችን አእምሮዎ የአያትዎን የኩኪ አሰራር በሚይዝበት መንገድ አያከማቹም፤ በምትኩ፣ ከዚህ በፊት በመጣው ላይ በመመስረት የሚቀጥለውን ቃል (ቶከን) ለመገመት የሰለጠኑ ናቸው [2]። በተግባር፣ ይህ ማለት ግንኙነቶችን ይያዛሉ ማለት ነው፡ የትኞቹ ቃላት አንድ ላይ እንደሚገናኙ፣ ዓረፍተ ነገሮች ብዙውን ጊዜ እንዴት ቅርፅ እንደሚይዙ፣ ሙሉ ሀሳቦች እንደ ስካፎልዲንግ እንዴት እንደሚገነቡ። ለዚህም ነው ውጤቱ የሚመስለው ፣ ምንም እንኳን ሙሉ ሐቀኝነት - ሙሉ በሙሉ ሐቀኝነት - የስታቲስቲክስ ማስመሰል እንጂ ግንዛቤ አይደለም [4]።

ታዲያ በAI የተፈጠረ መረጃን ጠቃሚ ? ጥቂት ነገሮች

  • የውሂብ ልዩነት - ከአንድ ጠባብ ዥረት ሳይሆን ከስፍር ቁጥር ከሌላቸው ምንጮች የሚወጣ።

  • ዝማኔዎች - የማደስ ዑደቶች ሳይኖሩ፣ በፍጥነት ያልቃል።

  • ማጣሪያ - ቆሻሻው ወደ ውስጥ ከመግባቱ በፊት ቢይዝ ይመረጣል (ነገር ግን፣ እውነቱን እንነጋገር፣ ያ መረብ ቀዳዳዎች አሉት)።

  • ክሮስ-ቼክ - በባለስልጣን ምንጮች (ናሳ፣ WHO፣ ዋና ዋና ዩኒቨርሲቲዎችን ያስቡ) ላይ መደገፍ፣ ይህም በአብዛኛዎቹ የ AI አስተዳደር መጽሐፍት ውስጥ የግድ ሊኖር የሚገባው ነው [3]።

ቅዠቶች የሚባሉት ? በመሠረቱ የተወለወሉ ከንቱ ነገሮች ቀጥ ባለ ፊት የሚቀርቡ ናቸው [2][3]።

ከዚህ ጽሑፍ በኋላ ሊያነቧቸው የሚችሏቸው ጽሑፎች፡

🔗 የኤአይአይ የሎተሪ ቁጥሮችን መተንበይ ይችላል?
ስለ AI ሎተሪ ትንበያዎች አፈ ታሪኮችን እና እውነታዎችን ማሰስ።.

🔗 ለ AI ሁሉን አቀፍ አቀራረብ መውሰድ ምን ማለት ነው?
በሥነ ምግባር እና በተፅዕኖ ላይ ሚዛናዊ አመለካከቶችን በመጠቀም የአዕምሮ ጤናን መረዳት።.

🔗 መጽሐፍ ቅዱስ ስለ አርቲፊሻል ኢንተለጀንስ ምን ይላል?
ስለ ቴክኖሎጂ እና ስለ ሰው ልጅ አፈጣጠር መጽሐፍ ቅዱሳዊ አመለካከቶችን መመርመር።.


ፈጣን ንጽጽር፡ AI ከየት እንደሚወጣ 📊

እያንዳንዱ ምንጭ እኩል አይደለም፣ ነገር ግን እያንዳንዱ የራሱ ሚና ይጫወታል። የቅጽበታዊ ገጽ እይታ ይኸውና።.

የምንጭ አይነት ማን ይጠቀምበታል (AI) ዋጋ/ዋጋ ለምን እንደሚሰራ (ወይም እንደማይሰራ)
መጽሐፍት እና ጽሑፎች ትላልቅ የቋንቋ ሞዴሎች በዋጋ የማይተመን (ኢሽ) ጥቅጥቅ ያለ፣ የተዋቀረ እውቀት - በፍጥነት ያረጃል።.
ድር ጣቢያዎች እና ጦማሮች ሁሉም ማለት ይቻላል AIዎች ነፃ (ከጫጫታ ጋር) የዱር ዝርያ፤ የብሩህነት እና የፍፁም ቆሻሻ ድብልቅ።.
የአካዳሚክ ወረቀቶች ምርምር-ከባድ የአይ.አይ አንዳንድ ጊዜ የክፍያ ግድግዳ ጥብቅነት + ተዓማኒነት፣ ነገር ግን በከባድ ቃላት የተደገፈ።.
የተጠቃሚ ውሂብ ለግል የተበጁ የአይአይ አይነቶች በጣም ስሜታዊ ⚠️ ስለታም ስፌት፣ ግን የግላዊነት ራስ ምታት ነው።.
የእውነተኛ ጊዜ ድር ከፍለጋ ጋር የተገናኙ ኤአይዎች ነፃ (በመስመር ላይ ከሆነ) መረጃን ትኩስ አድርጎ ያቆያል፤ ጉዳቱ ደግሞ ወሬዎችን የማጉላት አደጋ ነው።.

የሥልጠና መረጃ ዓለም 🌌

ይህ “የልጅነት ትምህርት” ምዕራፍ ነው። አንድ ልጅ በሚሊዮን የሚቆጠሩ የታሪክ መጽሐፍት፣ የዜና ክሊፖች እና የዊኪፔዲያ የጥንቸል ጉድጓዶችን በአንድ ጊዜ ሲሰጥ አስቡት። ቅድመ-ስልጠና የሚመስለው ይህ ነው። በእውነተኛው ዓለም፣ አቅራቢዎች በይፋ የሚገኙ መረጃዎችን፣ ፈቃድ ያላቸውን ምንጮች እና በአሰልጣኝ የመነጨ ጽሑፍን [2]።

ከላይ የተደረደረ፡ የተመረጡ የሰው ምሳሌዎች - ጥሩ መልሶች፣ መጥፎ መልሶች፣ በትክክለኛው አቅጣጫ መገፋፋት - ማጠናከሪያው ከመጀመሩ በፊት እንኳን [1]።.

የግልጽነት ማስጠንቀቂያ፡ ኩባንያዎች እያንዳንዱን ዝርዝር መረጃ አይገልጹም። አንዳንድ መከላከያዎች ሚስጥራዊነት (አይፒ፣ የደህንነት ስጋቶች) ናቸው፣ ስለዚህ ትክክለኛውን ድብልቅ በከፊል ብቻ ያገኛሉ [2]።.


በእውነተኛ ጊዜ ፍለጋ፡ ተጨማሪ ቶፒንግ 🍒

አንዳንድ ሞዴሎች አሁን ከስልጠና አረፋቸው ውጭ ማየት ይችላሉ። ያ ማለት ሪሰፕሽኔ-አጉመንትድ ጀነሬሽን (RAG) ነው - በመሠረቱ ከቀጥታ መረጃ ጠቋሚ ወይም ከዶክ መደብር ቁርጥራጮችን በመሳብ እና ከዚያም ወደ መልሱ [5] በማሸብለል። እንደ የዜና አርዕስተ ዜናዎች ወይም የአክሲዮን ዋጋዎች ላሉ በፍጥነት ለሚለዋወጡ ነገሮች ተስማሚ ነው።

ችግሩ? በይነመረቡ እኩል የሆነ ብልህነት እና የቆሻሻ እሳት ነው። የማጣሪያዎች ወይም የመነሻ ፍተሻዎች ደካማ ከሆኑ፣ የቆሻሻ መረጃ ወደ አደጋ ማዕቀፎች የሚያስጠነቅቁትን በትክክል ሾልኮ የመመለስ አደጋ ያጋጥሙዎታል [3]።.

የተለመደ መፍትሔ፡ ኩባንያዎች ሞዴሎችን ከራሳቸው ውስጣዊ የውሂብ ጎታዎች ጋር ያገናኛሉ፣ ስለዚህ መልሶች አሁን ያለውን የሰው ኃይል ፖሊሲ ወይም የዘመነ የምርት ሰነድ ከመጥቀስ ይልቅ ይጠቅሳሉ። ያስቡ፡ ጥቂት “ኧረ-ኦህ” ጊዜያት፣ የበለጠ አስተማማኝ ምላሾች።


የማጣራት ስራ፡ የAI የማጥራት ደረጃ 🧪

ጥሬ የተዘጋጁ ሞዴሎች ሻካራ ናቸው። ስለዚህ በደንብ ይጣጣማሉ

  • ጠቃሚ፣ ምንም ጉዳት የሌላቸው፣ ሐቀኞች እንዲሆኑ ማስተማር (ከሰው ግብረመልስ በማጠናከሪያ ትምህርት፣ RLHF) [1]።

  • አደገኛ ወይም መርዛማ ጠርዞችን ማሸግ (አሰላለፍ) [1]።.

  • ለድምፅ ማስተካከል - ወዳጃዊ፣ መደበኛ ወይም በቀልድ መልክ።.

አልማዝ ማጥራት ማለት እንደ የውይይት አጋር ባህሪን ወደ ስታቲስቲክስ ደረጃ ማሸጋገር ማለት አይደለም።.


ውድቀቶች እና ውድቀቶች 🚧

እንከን የለሽ እንደሆነ አድርገን አናስብ፦

  • ቅዠቶች - ግልጽ ያልሆኑ እና የተሳሳቱ ግልጽ መልሶች [2][3]።

  • አድልዎ - በውሂቡ ውስጥ የተጋገሩ ቅጦችን ያንፀባርቃል፤ ምልክት ካልተደረገበት እንኳን ሊያጎላቸው ይችላል [3][4]።

  • ምንም አይነት የመጀመሪያ እጅ ተሞክሮ የለም ማውራት ይችላል ነገር ግን አንዱንም አልቀመሰም [4]።

  • ከመጠን በላይ በራስ መተማመን - ንግግሩ እንደሚያውቀው ይፈስሳል፣ ምንም እንኳን ባይታወቅም። የአደጋ ማዕቀፎች ግምቶችን በመጠቆም ላይ ያተኩራሉ [3]።


ለምን እንደሚሰማኝ 🧠

ምንም እምነት የለውም፣ በሰው ልጅ ስሜት ምንም ትዝታ የለውም፣ እና በእርግጠኝነት ምንም አይነት ራስ የለውም። ሆኖም ዓረፍተ ነገሮችን በተቀላጠፈ ሁኔታ ስለሚያስተሳስር፣ አእምሮህ እንደተረዳው ያነበዋል እየሆነ ያለው ነገር ሰፊ የሆነ ቀጣይ ትንበያ ፡ በሰከንዶች ውስጥ በትሪሊዮን የሚቆጠሩ እድሎችን መጨመር [2]።

የ"ብልህነት" ስሜት ብቅ ያለ ባህሪ ነው - ተመራማሪዎች "የስቶካስቲክ ፓሮት" ውጤት ብለው ይጠሩታል [4]።


ለልጆች ተስማሚ አናሎግ 🎨

በቤተ መፃህፍት ውስጥ ያለውን እያንዳንዱን መጽሐፍ የሚያነብ በቀቀን አስቡት። ታሪኮቹን አያገኝም ነገር ግን ቃላቶቹን ወደ ጥበብ የሚመስል ነገር ሊያዋህድ ይችላል። አንዳንድ ጊዜ በትክክል የሚስማማ ነው፤ አንዳንድ ጊዜ ደግሞ ከንቱ ነው - ነገር ግን በቂ ቅልጥፍና ሲኖር ሁልጊዜ ልዩነቱን መለየት አይቻልም።


ማጠቃለያ፡ የ AI መረጃ ከየት እንደሚመጣ 📌

በቀላል አነጋገር፦

  • ግዙፍ የሥልጠና መረጃ (በሕዝብ + ፈቃድ + በአሰልጣኝ የተፈጠረ) [2]።

  • ቃና/ባህሪን ለመቅረጽ ከሰው ግብረመልስ ጋር ማጣራት

  • ከቀጥታ የውሂብ ዥረቶች ጋር ሲገናኙ የማግኛ ስርዓቶች

አርቴፊሻል ኢንተለጀንስ (AI) ነገሮችን "አያውቅም" - ጽሑፍን ይተነብያል ። ያ ሁለቱም ልዕለ ኃያሉ እና የአቺልስ ተረከዝ ነው። ዋናው ነጥብ? ሁልጊዜ አስፈላጊዎቹን ነገሮች ከታመነ ምንጭ ጋር ያጣሩ [3]።


ማጣቀሻዎች

  1. ኦያንግ፣ ኤል. እና ሌሎች (2022)። መመሪያዎችን በሰው አስተያየት ለመከተል የቋንቋ ሞዴሎችን ማሰልጠን (InstructGPT)arXiv

  2. ኦፕንአይአይ (2023)። የጂፒቲ-4 ቴክኒካል ሪፖርት - የተፈቀደለት፣ የህዝብ እና የሰው ልጅ የተፈጠረ መረጃ ድብልቅ፤ የቀጣይ-ቶከን ትንበያ ዓላማ እና ገደቦች። arXiv

  3. NIST (2023)። የAI የአደጋ አስተዳደር ማዕቀፍ (AI RMF 1.0) - አመጣጥ፣ አስተማማኝነት እና የአደጋ መቆጣጠሪያዎች። ፒዲኤፍ

  4. ቤንደር፣ ኤም፣ ገብሩ፣ ቲ.፣ ማክሚላን-ሜጀር፣ ኤ.፣ ሚቸል፣ ኤስ. (2021)። ስለ ስቶካስቲክ ፓሮቶች አደጋዎች፡ የቋንቋ ሞዴሎች በጣም ትልቅ ሊሆኑ ይችላሉ? ፒዲኤፍ

  5. ሉዊስ፣ ፒ. እና ሌሎችም (2020)። ለእውቀት-ከፍተኛ የNLP መልሶ ማግኛ-የተሻሻለ ትውልድarXiv


የቅርብ ጊዜውን የ AI ኦፊሴላዊ የ AI ረዳት መደብር ያግኙ

ስለ እኛ

ወደ ጦማር ተመለስ