የአኖማሊ ምርመራ የመረጃ ስራዎች ጸጥተኛ ጀግና ነው - ነገሮች ከመቃጠላቸው በፊት በሹክሹክታ የሚጮኸው የጭስ ማንቂያ።
በቀላል አነጋገር፡ AI “መደበኛ-ኢሽ” ምን እንደሚመስል ይማራል፣ ለአዳዲስ ክስተቶች ያልተለመደ ውጤት ፣ ከዚያም በገደብ ። ዲያብሎስ “መደበኛ-ኢሽ” የሚለውን እንዴት እንደሚገልጹት ነው፣ መረጃዎ ወቅታዊ፣ የተዝረከረከ፣ የሚንሳፈፍ እና አልፎ አልፎ ለእርስዎ የሚዋሽ ነው። [1]
ከዚህ ጽሑፍ በኋላ ሊያነቧቸው የሚችሏቸው ጽሑፎች፡
🔗 የአዕምሮ ህክምና ባለሙያ (AI) ለኅብረተሰቡ ጎጂ ሊሆን የሚችለው ለምንድን ነው?
በስፋት የሚካሄደውን የአዕምሮ ህክምና ባለሙያ (AI) ጉዲፈቻ ሥነ ምግባራዊ፣ ኢኮኖሚያዊ እና ማህበራዊ አደጋዎችን ይመረምራል።
🔗 የውሃ AI ስርዓቶች ምን ያህል እንደሚጠቀሙ
የውሂብ ማዕከል ማቀዝቀዣ፣ የሥልጠና ፍላጎቶች እና የአካባቢ የውሃ ተፅእኖን ያብራራል።
🔗 የAI የውሂብ ስብስብ ምን እንደሆነ እና ለምን አስፈላጊ እንደሆነ
የውሂብ ስብስቦችን፣ መለያዎችን፣ ምንጮችን እና በሞዴል አፈጻጸም ውስጥ ያላቸውን ሚና ይገልጻል።
🔗 AI ከተወሳሰበ መረጃ አዝማሚያዎችን እንዴት እንደሚተነብይ
የንድፍ ማወቂያን፣ የማሽን መማሪያ ሞዴሎችን እና የእውነተኛ ዓለም ትንበያ አጠቃቀሞችን ይሸፍናል።
"AI ያልተለመዱ ነገሮችን እንዴት ለይቶ ያውቃል?"
በእውነተኛ፣ ፍጽምና በሌለው መረጃ ላይ ሲተገብሩ መካኒኮቹን እና
-
መሰረታዊ ግብዓቶችን አሳይ ፡ ባህሪያት ፣ መሰረታዊ ነገሮች ፣ ውጤቶች እና ገደቦች ። [1]
-
ተግባራዊ ቤተሰቦችን ያወዳድሩ፡ ርቀት፣ ጥግግት፣ አንድ-ክፍል፣ ማግለል፣ ፕሮባቢሊቲክ፣ እንደገና ግንባታ። [1]
-
የጊዜ ተከታታይ ችግሮችን ይቆጣጠሩ፡- “መደበኛ” የሚወሰነው በቀን ጊዜ፣ በሳምንቱ ቀን፣ በተለቀቀው እና በበዓላት ላይ ነው። [1]
-
ግምገማን እንደ እውነተኛ ገደብ አድርገው ይመለከቱት፡ የውሸት ማንቂያዎች የሚያበሳጩ ብቻ አይደሉም - እምነትን ያቃጥላሉ። [4]
-
"እንግዳ ነው" የሚለው ዋና ምክንያት ስላልሆነ ትርጓሜን + የሰው ልጅን በዑደት ውስጥ ማካተት። [5]
ዋና መካኒክስ፡ መሰረታዊ ነገሮች፣ ውጤቶች፣ ገደቦች 🧠
አብዛኛዎቹ ያልተለመዱ ስርዓቶች - ድንቅም ሆኑ አይደሉም - ወደ ሶስት የሚንቀሳቀሱ ክፍሎች ይወሰዳሉ፡
1) ውክልና (ወይም ሞዴሉ የሚያየው )
ባህሪያትን (የሚሽከረከሩ ስታቲስቲክስ፣ ጥምርታዎች፣ መዘግየት፣ ወቅታዊ ዴልታዎች) ወይም ውክልናዎችን (ኢምቤዲንግ፣ ንዑስ ክፍተቶች፣ ዳግም ግንባታዎች) መማር ይችላሉ ። [1]
2) ውጤት ማስመዝገብ (ይህ ምን ያህል “እንግዳ” ነው?)
የተለመዱ የውጤት ሀሳቦች የሚከተሉትን ያካትታሉ:
-
በርቀት ላይ የተመሰረተ ፡ ከጎረቤቶች የራቀ = አጠራጣሪ። [1]
-
በጥግግት ላይ የተመሰረተ ፡ ዝቅተኛ የአካባቢ ጥግግት = አጠራጣሪ (LOF የፖስተር ልጅ ነው)። [1]
-
የአንድ ክፍል ወሰኖች ፡- “መደበኛ” ይማሩ፣ ከውጭ የሚወጣውን ምልክት ያድርጉ። [1]
-
ፕሮባቢሊስቲክ ፡ በተገጠመለት ሞዴል ስር ዝቅተኛ የመሆን እድል = አጠራጣሪ። [1]
-
የመልሶ ግንባታ ስህተት ፡- በመደበኛ ሁኔታ የሰለጠነ ሞዴል እንደገና መገንባት ካልቻለ ምናልባት ተበላሽቷል። [1]
3) መዝለል (ወይም ደወሉን መቼ መጥራት እንዳለበት)
ገደቦች ሊስተካከሉ፣ በቁጥር ላይ የተመሰረቱ፣ በክፍል ወይም በዋጋ ላይ የተመሰረቱ ሊሆኑ ይችላሉ - ነገር ግን ከንቃት በጀቶች እና ከዝቅተኛ ወጪዎች ጋር መስተካከል
አንድ በጣም ተግባራዊ ዝርዝር፡ የsquit-learn ውጫዊ/አዲስ መመርመሪያዎች ጥሬ ውጤቶችን ከዚያም ገደብ (ብዙውን ጊዜ በብክለት አይነት ግምት የሚቆጣጠር) ይተገብራሉ። [2]
በኋላ ላይ ህመምን የሚከላከሉ ፈጣን ትርጓሜዎች 🧯
ከስውር ስህተቶች የሚያድኑህ ሁለት ልዩነቶች፡-
-
የውጭ ማወቂያ ፡ የስልጠና መረጃዎ አስቀድሞ ውጫዊ ነገሮችን ሊያካትት ይችላል፤ ስልተ ቀመሩ “ጥብቅ የሆነ መደበኛ ክልል”ን ለማንኛውም ለመምሰል ይሞክራል።
-
አዲስነት መለየት አዳዲስ ምልከታዎች ከተማሩት መደበኛ ንድፍ ጋር ይጣጣሙ እንደሆነ እየገመገሙ ነው
እንዲሁም፡- አዲስ ነገር ማወቅ ብዙውን ጊዜ እንደ አንድ-ክፍል ምደባ - ሞዴሊንግ መደበኛ ነው ምክንያቱም ያልተለመዱ ምሳሌዎች እምብዛም ወይም ያልተገለጹ በመሆናቸው። [1]

በእርግጥ የሚጠቀሙባቸው ቁጥጥር የማይደረግባቸው የስራ ፈረሶች 🧰
መለያዎች እጥረት ሲኖርባቸው (ይህም በመሠረቱ ሁልጊዜ ነው)፣ እነዚህ በእውነተኛ የቧንቧ መስመሮች ውስጥ የሚታዩ መሳሪያዎች ናቸው፡
-
የመገለል ደን ፡ በብዙ ታብሌቶች ውስጥ ጠንካራ ነባሪ፣ በተግባር በስፋት ጥቅም ላይ የሚውል እና በስኪት-ለርን ውስጥ የሚተገበር። [2]
-
አንድ-ክፍል SVM ፡ ውጤታማ ሊሆን ይችላል ነገር ግን ለቅኝት እና ለግምቶች ስሜታዊ ነው፤ scikit-learn ጥንቃቄ የተሞላበት የሃይፐርፓራሜትር ማስተካከያ አስፈላጊነትን በግልጽ ያሳያል። [2]
-
አካባቢያዊ ውጫዊ ፋክተር (LOF) ፡ ክላሲክ ጥግግት ላይ የተመሠረተ ውጤት፤ “መደበኛ” ጥሩ ብልጭታ በማይሆንበት ጊዜ በጣም ጥሩ። [1]
ተግባራዊ የጌቻ ቡድኖች በየሳምንቱ እንደገና ያገኛሉ፡ LOF በስልጠናው ስብስብ ላይ ከአዲስ ውሂብ ጋር ሲነጻጸር አዲስ ነገርን ለይቶ ማወቅ ላይ በመመስረት በተለየ መንገድ ይሠራል - scikit-learn even novelty=True የማይታዩ ነጥቦችን ደህንነቱ በተጠበቀ ሁኔታ ለማስመዝገብ ይፈልጋል። [2]
ውሂብ ሻካራ በሚሆንበት ጊዜ አሁንም የሚሰራ ጠንካራ መሰረታዊ መስመር 🪓
"እኛ የምንፈልገው ወደ ረስተን የማያመራን ነገር ብቻ ነው" በሚለው ሁነታ ላይ ከሆኑ፣ ጠንካራ ስታቲስቲክስ ዝቅተኛ ደረጃ ይሰጣቸዋል።
የተሻሻለው የ z-ነጥብ ለከፍተኛ እሴቶች ስሜታዊነትን ለመቀነስ ሚዲያን እና ኤምኤዲ (median absolute divideration) ይጠቀማል 3.5 ። [3]
ይህ እያንዳንዱን ያልተለመደ ችግር አይፈታም - ነገር ግን ብዙውን ጊዜ ጠንካራ የመጀመሪያ የመከላከያ መስመር ነው፣ በተለይም ለጫጫታ መለኪያዎች እና ለቅድመ-ደረጃ ክትትል። [3]
የጊዜ ተከታታይ እውነታ፡- “መደበኛ” የሚወሰነው መቼ እንደሆነ ነው ⏱️📈
የጊዜ ተከታታይ ያልተለመዱ ነገሮች አስቸጋሪ ናቸው ምክንያቱም አውዱ ዋናው ነጥብ ነው፡ እኩለ ቀን ላይ ጭማሪ ሊጠበቅ ይችላል፤ በ3 ሰዓት ላይ ተመሳሳይ ጭማሪ አንድ ነገር እየተቃጠለ መሆኑን ሊያመለክት ይችላል። ስለዚህ ብዙ ተግባራዊ ስርዓቶች ጊዜን የሚያውቁ ባህሪያትን (መዘግየት፣ ወቅታዊ ዴልታዎች፣ የሚሽከረከሩ መስኮቶች) እና ከሚጠበቀው ንድፍ አንጻር የውጤት ልዩነቶችን በመጠቀም መደበኛነትን ይቀርፃሉ። [1]
አንድ ህግ ብቻ የሚያስታውሱ ከሆነ ፡ የግማሽ ትራፊክዎን “ያልተለመደ” ከማወጅዎ በፊት የመነሻ መስመርዎን (ሰዓት/ቀን/ክልል/የአገልግሎት ደረጃ) ይከፋፍሉ
ግምገማ፡ ብርቅዬ-ክስተት ወጥመድ 🧪
የአኖማሊ ምርመራ ብዙውን ጊዜ "በሣር ክምር ውስጥ በመርፌ" ነው፣ ይህም ግምገማውን እንግዳ ያደርገዋል፡
-
የROC ኩርባዎች አወንታዊ ነገሮች ብርቅ ሲሆኑ በሚያታልል ሁኔታ ጥሩ ሊመስሉ ይችላሉ።
-
ትክክለኛ የማስታወሻ እይታዎች ብዙውን ጊዜ ሚዛናዊ ባልሆኑ ቅንብሮች ላይ የበለጠ መረጃ ሰጪ ናቸው ምክንያቱም በአዎንታዊ ክፍል ላይ ባለው አፈጻጸም ላይ ያተኩራሉ። [4]
-
የማስጠንቀቂያ በጀትም ያስፈልግዎታል ፡- ሰዎች ቁጣቸውን ሳያቆሙ በሰዓት ስንት ማንቂያዎችን በትክክል መለየት ይችላሉ? [4]
በሚሽከረከሩ መስኮቶች ላይ የኋላ ሙከራ ማድረግ ክላሲክ የውድቀት ሁነታን እንዲይዙ ይረዳዎታል፡ "በሚያምር ሁኔታ ይሰራል… ባለፈው ወር ስርጭት ላይ።" [1]
የመተርጎም እና የስር መንስኤ፡ ስራዎን ያሳዩ 🪄
ያለ ማብራሪያ ማስጠንቀቂያ መስጠት ሚስጥራዊ የፖስታ ካርድ እንደማግኘት ነው። ጠቃሚ ነው፣ ግን ያበሳጫል።
ለአኖማሊ ውጤት በጣም አስተዋፅዖ እንዳደረጉ በመጠቆም ወይም "ይህ የተለመደ እንዲመስል ምን መለወጥ አለበት?" የቅጥ ማብራሪያዎችን በመስጠት ሊረዱ ይችላሉ የትርጉም ማሽን መማሪያ መጽሐፍ ለተለመዱ ዘዴዎች (የSHAP አይነት ባህሪያትን ጨምሮ) እና ገደቦቻቸው ጠንካራ እና ወሳኝ መመሪያ ነው። [5]
ግቡ የባለድርሻ አካላት ምቾት ብቻ አይደለም - ፈጣን ምርመራ እና የተደጋገሙ ክስተቶች ቁጥር መቀነስ ነው።
የማሰማራት፣ የመንዳት እና የግብረመልስ ዑደቶች 🚀
ሞዴሎች በስላይድ ውስጥ አይኖሩም። በቧንቧ መስመር ውስጥ ይኖራሉ።
የተለመደ "የመጀመሪያው የምርት ወር" ታሪክ፡- መርማሪው በአብዛኛው ማሰማራትን፣ የቡድን ስራዎችን እና የጎደለ ውሂብን ያሳያል… ይህም አሁንም ጠቃሚ ምክንያቱም "የውሂብ ጥራት ክስተቶችን" ከ"የንግድ ያልተለመዱ ነገሮች" ለመለየት ስለሚያስገድድዎት።
በተግባር፡
-
የባህሪ ለውጥ ሲከሰት መንሸራተትን ይከታተሉ
-
የምዝግብ ማስታወሻ ግብዓቶች + የሞዴል ስሪት ስለዚህ የሆነ ነገር ለምን ገጽ እንደተለጠፈ እንደገና ማባዛት ይችላሉ። [5]
-
በጊዜ ሂደት ገደቦችን እና ክፍሎችን ለማስተካከል የሰው ግብረመልስን (ጠቃሚ እና ጫጫታ ማንቂያዎች) ይቅረጹ
የደህንነት አንግል፡ IDS እና የባህሪ ትንተና 🛡️
የደህንነት ቡድኖች ብዙውን ጊዜ ያልተለመዱ ሀሳቦችን ከደንብ ላይ ከተመሠረተ ማወቂያ ጋር ያዋህዳሉ፡- ለ"መደበኛ የአስተናጋጅ ባህሪ" መሰረታዊ ነገሮች፣ እንዲሁም ለሚታወቁ መጥፎ ቅጦች ፊርማዎችን እና ፖሊሲዎችን። የNIST SP 800-94 (Final) ለጣልቃ ገብነት ማወቂያ እና መከላከያ ስርዓት ጉዳዮች በስፋት የሚጠቀስ ፍሬም ሆኖ ቀጥሏል፤ እንዲሁም የ2012 ረቂቅ "Rev. 1" የመጨረሻ ሆኖ አያውቅም እና በኋላ ላይ ጡረታ እንደወጣ ይገልጻል። [3]
ትርጉም፡- MLን በሚረዳበት ቦታ ይጠቀሙ፣ ነገር ግን አሰልቺ የሆኑትን ደንቦች አይጣሉ - አሰልቺ ናቸው ምክንያቱም ይሰራሉ።
የንጽጽር ሰንጠረዥ፡- ታዋቂ ዘዴዎች በአጭሩ
| መሣሪያ / ዘዴ | ምርጥ ለ | ለምን እንደሚሰራ (በተግባር) |
|---|---|---|
| ጠንካራ / የተሻሻሉ የ z-ውጤቶች | ቀላል መለኪያዎች፣ ፈጣን የመነሻ መስመሮች | "በቂ" እና ያነሱ የውሸት ማንቂያዎች ሲያስፈልጉዎት ጠንካራ የመጀመሪያ ማለፊያ። [3] |
| የመነጠል ደን | የተደባለቀ፣ የተደራረቡ ባህሪያት | ጠንካራ ነባሪ ትግበራ እና በተግባር በስፋት ጥቅም ላይ የዋለ። [2] |
| አንድ-ክፍል SVM | የታመቁ "መደበኛ" አካባቢዎች | በወሰን ላይ የተመሰረተ አዲስ ነገር መለየት፤ ማስተካከያ በጣም አስፈላጊ ነው። [2] |
| የአካባቢ ውጫዊ ሁኔታ | ማኒፎልድ-ኢሽ ኖርማል | የጥግግት ንፅፅር ከጎረቤቶች ጋር ያለው ግንኙነት የአካባቢውን እንግዳ ነገር ይይዛል። [1] |
| የመልሶ ግንባታ ስህተት (ለምሳሌ፣ የራስ-ሰር-ኮደር-ቅጥ) | ከፍተኛ ልኬት ያላቸው ቅጦች | በተለመደው መንገድ ይለማመዱ፤ ትላልቅ የመልሶ ግንባታ ስህተቶች ልዩነቶችን ሊያመለክቱ ይችላሉ። [1] |
የማጭበርበሪያ ኮድ፡ በጠንካራ መሰረታዊ ነገሮች + አሰልቺ ቁጥጥር በማይደረግበት ዘዴ ይጀምሩ፣ ከዚያ የቤት ኪራይ በሚከፍልበት ጊዜ ብቻ ውስብስብነትን ይጨምሩ።
አጭር የጨዋታ መጽሐፍ፡ ከዜሮ እስከ ማንቂያዎች 🧭
-
"እንግዳ" የሚለውን በአሠራር (ዘግይቶ የመቆየት፣ የማጭበርበር አደጋ፣ የሲፒዩ ዝርፊያ፣ የክምችት አደጋ) ይግለጹ።
-
በመነሻ መስመር (ጠንካራ ስታቲስቲክስ ወይም የተከፋፈሉ ገደቦች) ይጀምሩ። [3]
-
እንደ መጀመሪያ ማለፊያ ይምረጡ
-
በማንቂያ በጀት ገደቦችን ያዘጋጁ ፣ እና አወንታዊ ነገሮች ብርቅ ከሆኑ በPR-style አስተሳሰብ ይገምግሙ። [4]
-
እያንዳንዱ ማንቂያ እንደገና ሊሰራ የሚችል እና ሊታረም የሚችል እንዲሆን ማብራሪያዎችን + ምዝግብ ማስታወሻ ያክሉ
-
ወደ ኋላ ተመለስ፣ ተጓዝ፣ ተማር፣ እንደገና አስተካክል - መንሸራተት የተለመደ ነው። [1]
የጊዜ ማህተሞችዎ ከቴፕ እና ከተስፋ ጋር አብረው የማይያዙ መሆናቸውን በማሰብ ይህንን በሳምንት ውስጥ በፍጹም ማድረግ ይችላሉ። 😅
የመጨረሻ አስተያየቶች - በጣም ረጅም ነው፣ አላነበብኩትም🧾
AI ያልተለመዱ ነገሮችን የሚለየው "መደበኛ" የሚለውን ተግባራዊ ምስል በመማር፣ ልዩነቶችን በመመዘን እና ገደብ የሚያልፈውን በመጠቆም ነው። ምርጥ ስርዓቶች የሚያሸንፉት ብልጭልጭ በመሆን ሳይሆን በመስተካከል ነው ፡ የተከፋፈሉ የመነሻ መስመሮች፣ የማንቂያ በጀቶች፣ ሊተረጎሙ የሚችሉ ውጤቶች እና ጫጫታ ያላቸውን ማንቂያዎች ወደ አስተማማኝ ምልክት የሚቀይር የግብረመልስ ዑደት። [1]
ማጣቀሻዎች
-
ፒሜንቴል እና ሌሎችም (2014) - የኖቬልት ዲቴክሽን ግምገማ (ፒዲኤፍ፣ የኦክስፎርድ ዩኒቨርሲቲ) ተጨማሪ ያንብቡ
-
scikit-learn Documentation - አዲስነት እና ውጫዊ መለየት ተጨማሪ ያንብቡ
-
NIST/SEMATECH ኢ-Handbook - የውጭ ሰዎችን ለይቶ ማወቅ ተጨማሪ ያንብቡ እና NIST CSRC - SP 800-94 (የመጨረሻ): የጣልቃ ገብነት ምርመራ እና መከላከያ ስርዓቶች (IDPS) መመሪያ ተጨማሪ ያንብቡ
-
ሳይቶ እና ሬህምስማየር (2015) - የፕሪሲሽን-ሪከርድ ሴራ ከ ROC ሴራ የበለጠ መረጃ ሰጪ ነው፣ ይህም ባልተመጣጠነ የውሂብ ስብስቦች ላይ ሁለትዮሽ ክላሲፋየሮችን ሲገመግም (PLOS ONE)። ተጨማሪ ያንብቡ
-
ሞልናር - ሊተረጎም የሚችል የማሽን መማሪያ (የድር መጽሐፍ) ተጨማሪ ያንብቡ