አጭር መልስ ፡ የAI ሞዴልን ማሰማራት ማለት የማቅረቢያ ንድፍ (በእውነተኛ ጊዜ፣ ባች፣ ዥረት ወይም ጠርዝ) መምረጥ ማለት ሲሆን ከዚያም መላውን መንገድ እንደገና ሊባዛ የሚችል፣ ሊታይ የሚችል፣ ደህንነቱ የተጠበቀ እና ሊቀለበስ የሚችል ማድረግ ማለት ነው። ሁሉንም ነገር ሲያስተካክሉ እና በምርት-መሰል የክፍያ ጭነቶች ላይ የp95/p99 መዘግየትን ሲለኩ፣ አብዛኛዎቹን “በላፕቶፔ ላይ የሚሰሩ” ብልሽቶች ያመልጣሉ።
ቁልፍ ነጥቦች፡
የማሰማራት ቅጦች፡- ለመሳሪያዎች ከመወሰንዎ በፊት በእውነተኛ ጊዜ፣ ባች፣ ዥረት ወይም ጠርዝ ይምረጡ።
መባዛት፡- መንሸራተትን ለመከላከል ሞዴሉን፣ ባህሪያቱን፣ ኮዱን እና አካባቢውን ሥሪት ያድርጉ።
ታዛቢነት፡- የዘገየነት ጅራትን፣ ስህተቶችን፣ ሙሌትን እና የውሂብ ወይም የውጤት ስርጭቶችን ያለማቋረጥ መከታተል።
ደህንነቱ የተጠበቀ ልቀት፡- አውቶማቲክ የመልሶ መመለሻ ገደቦችን በመጠቀም የካናሪ፣ ሰማያዊ-አረንጓዴ ወይም የጥላ ሙከራን ይጠቀሙ።
ደህንነት እና ግላዊነት ፡ የፈቃድ፣ የዋጋ ገደቦችን እና የሚስጥር አስተዳደርን ይተግብሩ፣ እና በምዝግብ ማስታወሻዎች ውስጥ PIIን ይቀንሱ።

ከዚህ ጽሑፍ በኋላ ሊያነቧቸው የሚችሏቸው ጽሑፎች፡
🔗 የ AI አፈፃፀምን እንዴት እንደሚለካ
አስተማማኝ የ AI ውጤቶችን ለማግኘት መለኪያዎችን፣ መለኪያዎችን እና የእውነተኛ ዓለም ቼኮችን ይማሩ።.
🔗 በ AI አማካኝነት ተግባራትን በራስ-ሰር እንዴት ማድረግ እንደሚቻል
ተደጋጋሚ ስራዎችን ወደ የስራ ፍሰቶች ይቀይሩት፤ ፕሮምፖችን፣ መሳሪያዎችን እና ውህደቶችን በመጠቀም።.
🔗 የ AI ሞዴሎችን እንዴት መሞከር እንደሚቻል
ሞዴሎችን በተጨባጭ ለማነፃፀር ግምገማዎችን፣ የውሂብ ስብስቦችን እና የውጤት አሰጣጥን ይንደፉ።.
🔗 እንዴት ከ AI ጋር መነጋገር እንደሚቻል
የተሻሉ ጥያቄዎችን ይጠይቁ፣ አውድ ያዘጋጁ እና ግልጽ መልሶችን በፍጥነት ያግኙ።.
1) “ማሰማራት” በእርግጥ ምን ማለት ነው (እና ለምን ኤፒአይ ብቻ እንዳልሆነ) 🧩
ሰዎች “ሞዴሉን አሰማራ” ሲሉ፣ ከእነዚህ ውስጥ የትኛውንም ማለት ይችላሉ፡
-
አንድ መተግበሪያ በእውነተኛ ጊዜ መደምደሚያን እንዲጠራ የመጨረሻ ነጥብን ያሳዩ ( Vertex AI: ሞዴልን ወደ መጨረሻ ነጥብ ያሰማሩ ፣ Amazon SageMaker: Real-time Infession )
-
በዳታቤዝ ውስጥ ትንበያዎችን ለማዘመን በየምሽቱ የባች ውጤት ያስመዝግቡ ( Amazon SageMaker Batch Transform )
-
የዥረት ማጠቃለያ (ክስተቶች ያለማቋረጥ ይመጣሉ፣ ትንበያዎች ያለማቋረጥ ይወጣሉ) (የደመና የውሂብ ፍሰት፡ በትክክል-አንድ ጊዜ ከቢያንስ አንድ ጊዜ ጋር ሲነጻጸር፣ የደመና የውሂብ ፍሰት ዥረት ሁነታዎች)
-
የጠርዝ ማሰማራት (ስልክ፣ አሳሽ፣ የተከተተ መሳሪያ ወይም "በፋብሪካ ውስጥ ያለ ትንሽ ሳጥን") (LiterT በመሳሪያ ላይ ያለ ማጠቃለያ፣ የLiterRT አጠቃላይ እይታ)
-
ውስጣዊ የመሳሪያ ማሰማራት (ተንታኝ የሚመለከት የተጠቃሚ በይነገጽ፣ ማስታወሻ ደብተሮች ወይም የታቀዱ ስክሪፕቶች)
ስለዚህ ማሰማራት “ሞዴሉን ተደራሽ ማድረግ” እና የበለጠ እንደሚከተለው ነው፡
-
ማሸግ + አገልግሎት + ልኬት + ክትትል + አስተዳደር + መልሶ መመለስ (ሰማያዊ-አረንጓዴ ማሰማራት)
ልክ እንደ ምግብ ቤት መክፈት ነው። በእርግጥ ጥሩ ምግብ ማብሰል አስፈላጊ ነው። ግን አሁንም ሕንፃውን፣ ሰራተኞቹን፣ ማቀዝቀዣውን፣ ምናሌዎቹን፣ የአቅርቦት ሰንሰለትን እና በእራት ውስጥ ያለውን ፍሪጅ ውስጥ ሳያለቅሱ የእራት ግርግርን ለመቋቋም የሚያስችል መንገድ ያስፈልግዎታል። ፍጹም ዘይቤ አይደለም… ግን ተረድተኸዋል። 🍝
2) “የAI ሞዴሎችን እንዴት ማሰማራት እንደሚቻል” ጥሩ ስሪት የሚያደርገው ምንድን ነው ✅
“ጥሩ ማሰማራት” በጣም ጥሩ በሆነ መንገድ አሰልቺ ነው። በጫና ስር አስቀድሞ የሚጠበቅ ባህሪ አለው፣ እና ካልሆነ በፍጥነት መመርመር ይችላሉ።.
"ጥሩ" የሚለው ቃል ብዙውን ጊዜ ምን እንደሚመስል እነሆ፦
-
ሊባዙ የሚችሉ ግንባታዎች
ተመሳሳይ ኮድ + ተመሳሳይ ጥገኝነቶች = ተመሳሳይ ባህሪ። ምንም የሚያስፈራ "በላፕቶፔዬ ላይ ይሰራል" ስሜት የለም 👻 (Docker: ኮንቴይነር ምንድን ነው?) -
ግልጽ የሆነ የበይነገጽ ኮንትራት
ግብዓቶች፣ ውጤቶች፣ ንድፎች እና የጠርዝ መያዣዎች ተገልጸዋል። ምንም አይነት አስገራሚ አይነቶች በ2 ሰዓት ላይ የሉም። (OpenAPI: OpenAPI ምንድን ነው?፣JSON Schema) -
ከእውነታው ጋር የሚዛመድ አፈጻጸም
በምርት መሰል ሃርድዌር እና በተጨባጭ ጭነቶች ላይ የሚለካ መዘግየት እና የውጤት መጠን። -
በጥርስ ክትትል፤
እርምጃ የሚቀሰቅሱ መለኪያዎች፣ ምዝግብ ማስታወሻዎች፣ ዱካዎች እና የመንሸራተት ፍተሻዎች (ማንም የማይከፍታቸው ዳሽቦርዶች ብቻ አይደሉም)። (SRE Book: Monitoring Distributed Systems) -
ደህንነቱ የተጠበቀ የልቀት ስትራቴጂ
ካናሪ ወይም ሰማያዊ-አረንጓዴ፣ ቀላል የመዝለል ስትራቴጂ፣ ጸሎት የማያስፈልገው ስሪት። (ካናሪ ልቀት፣ ሰማያዊ-አረንጓዴ ማሰማራት) -
የወጪ ግንዛቤ
"ፈጣን" ሂሳቡ የስልክ ቁጥር እስኪመስል ድረስ በጣም ጥሩ ነው 📞💸 -
በምስጢር አስተዳደር፣ በመዳረሻ ቁጥጥር፣ በPII አያያዝ እና በኦዲት አቅም ውስጥ ደህንነት እና ግላዊነት ተፈጥሯል ። ( Kubernetes Secrets ፣ NIST SP 800-122 )
እነዚህን በተከታታይ ማድረግ ከቻልክ፣ ከአብዛኞቹ ቡድኖች ቀድመህ ትሄዳለህ። እውነቱን እንነጋገር።.
3) ትክክለኛውን የማሰማሪያ ንድፍ ይምረጡ (መሳሪያዎችን ከመምረጥዎ በፊት) 🧠
የእውነተኛ ጊዜ የኤፒአይ ማጠቃለያ ⚡
ምርጥ ጊዜ፦
-
ተጠቃሚዎች ፈጣን ውጤቶችን ይፈልጋሉ (ምክሮች፣ የማጭበርበር ፍተሻዎች፣ ውይይት፣ ግላዊነት ማላበስ)
-
በጥያቄ ወቅት ውሳኔዎች መከሰት አለባቸው
ጥንቃቄዎች፡
-
p99 መዘግየት ከአማካይ በላይ አስፈላጊ ነው (The Tail at Scale፣ SRE መጽሐፍ፡ የተከፋፈሉ ስርዓቶችን መከታተል)
-
አውቶማቲክ ማስተካከያ ጥንቃቄ የተሞላበት ማስተካከያ ያስፈልገዋል (Kubernetes Horizontal Pod Autoscaling)
-
ቀዝቃዛ ጅምር ተንኮለኛ ሊሆን ይችላል… ልክ እንደ ድመት ብርጭቆ ከጠረጴዛው ላይ እየገፋች (AWS Lambda አፈጻጸም አካባቢ የህይወት ዑደት)
የቡድን ውጤት 📦
ምርጥ ጊዜ፦
-
ትንበያዎች ሊዘገዩ ይችላሉ (በአንድ ሌሊት የአደጋ ውጤት፣ የማቋረጥ ትንበያ፣ የETL ማበልጸጊያ) (የአማዞን ሳጅሜከር ባች ትራንስፎርም)
-
ወጪ ቆጣቢነት እና ቀላል ስራዎችን ይፈልጋሉ
ጥንቃቄዎች፡
-
የውሂብ ትኩስነት እና የኋላ መሙላት
-
የባህሪ ሎጂክን ከስልጠና ጋር ወጥነት እንዲኖረው ማድረግ
የዥረት ማጠቃለያ 🌊
ምርጥ ጊዜ፦
-
ክስተቶችን ያለማቋረጥ ያካሂዳሉ (IoT፣ clickstreams፣ የክትትል ስርዓቶች)
-
ጥብቅ የጥያቄ-ምላሽ ሳይኖር በእውነተኛ ጊዜ የሚደረጉ ውሳኔዎችን ይፈልጋሉ
ጥንቃቄዎች፡
-
በትክክል-አንድ ጊዜ እና ቢያንስ አንድ ጊዜ ትርጉሞች (የደመና ዳታ ፍሰት፡ በትክክል-አንድ ጊዜ እና ቢያንስ-አንድ ጊዜ)
-
የክልል አስተዳደር፣ ድጋሚ ሙከራዎች፣ እንግዳ የሆኑ ድግግሞሾች
የጠርዝ ማሰማራት 📱
ምርጥ ጊዜ፦
-
የአውታረ መረብ ጥገኝነት ሳይኖር ዝቅተኛ መዘግየት (LiterRT on-device inívement)
-
የግላዊነት ገደቦች
-
ከመስመር ውጭ አካባቢዎች
ጥንቃቄዎች፡
-
የሞዴል መጠን፣ ባትሪ፣ መጠን፣ የሃርድዌር መከፋፈል (ከስልጠና በኋላ ያለው መጠን (የቴንሶርፍሎው ሞዴል ማመቻቸት))
-
ዝማኔዎች አስቸጋሪ ናቸው (በዱር ውስጥ 30 ስሪቶችን አይፈልጉም…)
መጀመሪያ ንድፉን ይምረጡ፣ ከዚያም ቁልል ይምረጡ። አለበለዚያ አንድ ካሬ ሞዴል ክብ የሩጫ ጊዜ እንዲያገኝ ያስገድዱታል። ወይም እንደዚህ ያለ ነገር። 😬
4) ሞዴሉን ከምርት ጋር እንዳይገናኝ በማሸግ ማሸግ 📦🧯
አብዛኛዎቹ "ቀላል ማሰማራቶች" በጸጥታ የሚሞቱበት ቦታ ይህ ነው።.
የሁሉም ነገር ስሪት (አዎ፣ ሁሉም ነገር)
-
የሞዴል ቅርስ (ክብደቶች፣ ግራፍ፣ ቶኬይዘር፣ የመለያ ካርታዎች)
-
የባህሪ አመክንዮ (ለውጥ፣ መደበኛነት፣ ኢንኮደር)
-
የማጣቀሻ ኮድ (ቅድመ-ሂደት/ድህረ-ሂደት)
-
አካባቢ (ፓይዘን፣ CUDA፣ የስርዓት ሊብስ)
የሚሰራ ቀላል አቀራረብ፡
-
ሞዴሉን እንደ የተለቀቀ ቅርስ አድርገው ይመለከቱት
-
በስሪት መለያ ያስቀምጡት
-
የሞዴል ካርድ አይነት ሜታዳታ ፋይል ያስፈልጋል፡ ንድፍ፣ መለኪያዎች፣ የሥልጠና የውሂብ ቅጽበታዊ ገጽ እይታ ማስታወሻዎች፣ የታወቁ ገደቦች (ለሞዴል ሪፖርት የሚሆኑ የሞዴል ካርዶች)
ኮንቴይነሮች ይረዳሉ፣ ግን አታምልኳቸው 🐳
ኮንቴይነሮች በጣም ጥሩ ናቸው ምክንያቱም የሚከተሉት ናቸው፦
-
የፍሬን ጥገኛነቶች (Docker: ኮንቴይነር ምንድን ነው?)
-
ግንባታዎችን መደበኛ ማድረግ
-
የማሰማራት ኢላማዎችን ቀላል ማድረግ
ግን አሁንም የሚከተሉትን ማስተዳደር ያስፈልግዎታል:
-
የመሠረት ምስል ዝመናዎች
-
የጂፒዩ ነጂዎች ተኳሃኝነት
-
የደህንነት ቅኝት
-
የምስል መጠን (ማንም ሰው 9GB “ሰላም ዓለም” አይወድም) (የዶከር ግንባታ ምርጥ ልምዶች)
በይነገጹን መደበኛ ያድርጉት
የግቤት/ውጤት ቅርጸትዎን ቀደም ብለው ይወስኑ፦
-
ለቀላልነት JSON (ቀርፋፋ፣ ግን ወዳጃዊ) (JSON Schema)
-
የአፈጻጸም ፕሮቶቡፍ (የፕሮቶኮል ባፈሮች አጠቃላይ እይታ)
-
ለምስሎች/ኦዲዮ በፋይል ላይ የተመሰረቱ የክፍያ ጭነቶች (እንዲሁም ሜታዳታ)
እና እባክዎን ግብዓቶችን ያረጋግጡ። ልክ ያልሆኑ ግብዓቶች “ለምን ከንቱ ትኬቶችን እየመለሰ ነው” የሚለው ዋነኛው ምክንያት ናቸው። (OpenAPI: OpenAPI ምንድን ነው?፣JSON Schema)
5) የማገልገል አማራጮች - ከ"ቀላል ኤፒአይ" እስከ ሙሉ የሞዴል አገልጋዮች 🧰
ሁለት የተለመዱ መንገዶች አሉ፡
አማራጭ ሀ፡ የመተግበሪያ አገልጋይ + የግምታዊ ኮድ (የፈጣን ኤፒአይ አይነት አቀራረብ) 🧪
ሞዴሉን የሚጭን እና ትንበያዎችን የሚመልስ ኤፒአይ ትጽፋለህ። (FastAPI)
ጥቅሞች፡
-
ለማበጀት ቀላል
-
ለቀላል ሞዴሎች ወይም ለቅድመ-ደረጃ ምርቶች በጣም ጥሩ
-
ቀጥተኛ ፈቃድ፣ ማስተላለፊያ እና ውህደት
ጉዳቶች፡
-
የአፈጻጸም ማስተካከያ (ባቺንግ፣ ክር ማድረግ፣ የጂፒዩ አጠቃቀም) የእርስዎ ባለቤት ነው
-
አንዳንድ ጎማዎችን እንደገና ታድሳለህ፣ ምናልባት መጀመሪያ ላይ መጥፎ ሊሆን ይችላል
አማራጭ ለ፡ የሞዴል አገልጋይ (TorchServe / Triton-style approach) 🏎️
የሚከተሉትን የሚያስተናግዱ ልዩ አገልጋዮች
-
ተመሳሳይነት (ትሪቶን፡ ተመሳሳይነት ያለው ሞዴል አፈፃፀም)
-
በርካታ ሞዴሎች
-
የጂፒዩ ቅልጥፍና
-
ደረጃውን የጠበቁ የመጨረሻ ነጥቦች (TorchServe ሰነዶች፣ Triton Inference Server ሰነዶች)
ጥቅሞች፡
-
የተሻሉ የአፈጻጸም ቅጦች ከሳጥኑ ውጭ
-
በማገልገል እና በንግድ ሎጂክ መካከል ንጹህ መለያየት
ጉዳቶች፡
-
ተጨማሪ የአሠራር ውስብስብነት
-
ውቅር… እንደ የሻወር ሙቀት ማስተካከል ያለ አስጨናቂ ሊመስል ይችላል
የተቀላቀለ ንድፍ በጣም የተለመደ ነው፦
-
የሞዴል አገልጋይ ለግምታዊ (Triton: Dynamic batching)
-
ለፈቃድ ቀጭን የኤፒአይ ጌትዌይ፣ የጥያቄ ቅርፅ፣ የንግድ ደንቦች እና የዋጋ ገደብ (ኤፒአይ ጌትዌይ throttling)
6) የንፅፅር ሰንጠረዥ - ለማሰማራት ታዋቂ መንገዶች (በሐቀኝነት ስሜት) 📊😌
ከዚህ በታች ሰዎች የ AI ሞዴሎችን እንዴት ማሰማራት እንደሚቻል ሲያውቁ የሚጠቀሙባቸውን አማራጮች ተግባራዊ ቅጽበታዊ ገጽ እይታ ነው ።
| መሳሪያ / አቀራረብ | ታዳሚዎች | ዋጋ | ለምን እንደሚሰራ |
|---|---|---|---|
| Docker + FastAPI (ወይም ተመሳሳይ) | ትናንሽ ቡድኖች፣ ጅምር ኩባንያዎች | ፍሪ-ኢሽ | ቀላል፣ ተለዋዋጭ፣ ለመላክ ፈጣን - ማንኛውንም የመጠን ችግር "ይሰማዎት" (ዶከር፣ ፈጣን ኤፒአይ) |
| ኩበርኔትስ (እራስዎ ያድርጉት) | የመድረክ ቡድኖች | ኢንፍራ-ጥገኛ | ቁጥጥር + ሊሰፋ የሚችል… እንዲሁም፣ ብዙ እጀታዎች፣ አንዳንዶቹ የተረገሙ ናቸው (Kubernetes HPA) |
| የሚተዳደር የML መድረክ (የደመና ML አገልግሎት) | አነስተኛ ኦፕሬሽን የሚፈልጉ ቡድኖች | እየሄዱ ሲሄዱ ይክፈሉ | አብሮገነብ የማሰማራት የስራ ፍሰቶች፣ የክትትል መንጠቆዎች - አንዳንድ ጊዜ ሁልጊዜ ለሚሰሩ የመጨረሻ ነጥቦች ውድ ናቸው (Vertex AI ማሰማራት፣ SageMaker በእውነተኛ ጊዜ መደምደሚያ) |
| አገልጋይ አልባ ተግባራት (ለቀላል ድምዳሜ) | በክስተት ላይ የተመሰረቱ መተግበሪያዎች | በጥቅም ላይ ይክፈሉ | ለተጨናነቀ የትራፊክ ፍሰት በጣም ጥሩ ነው - ነገር ግን ቀዝቃዛ ጅምር እና የሞዴል መጠን ቀንዎን ሊያበላሹት ይችላሉ 😬 (የAWS Lambda ቀዝቃዛ ጅምር) |
| የ NVIDIA ትሪቶን ኢንፈረንስ አገልጋይ | በአፈጻጸም ላይ ያተኮሩ ቡድኖች | ነፃ ሶፍትዌር፣ የኢንፍራሬድ ወጪ | እጅግ በጣም ጥሩ የጂፒዩ አጠቃቀም፣ ባችኪንግ፣ ባለብዙ ሞዴል - ውቅር ትዕግስት ይጠይቃል (ትሪቶን፡ ዳይናሚክ ባቺንግ) |
| ቶርችሰርቭ | ፒቶርክ - ከባድ ቡድኖች | ነፃ ሶፍትዌር | ጥሩ ነባሪ የማቅረቢያ ቅጦች - ለከፍተኛ ደረጃ ማስተካከያ ሊያስፈልግ ይችላል (TorchServe docs) |
| ቤንቶኤምኤል (ማሸጊያ + አቅርቦት) | የኤምኤል መሐንዲሶች | ነፃ ኮር፣ ተጨማሪዎች ይለያያሉ | ለስላሳ ማሸጊያ፣ ጥሩ የገንቢ ተሞክሮ - አሁንም የኢንፍራሬድ ምርጫዎች ያስፈልጉዎታል (ለማሰማራት የቤንቶኤምኤል ማሸጊያ) |
| ሬይ ሰርቭ | የተከፋፈሉ ስርዓቶች ሰዎች | ኢንፍራ-ጥገኛ | በአግድም ሚዛን ይሰጣል፣ ለቧንቧ መስመሮች ጥሩ ነው - ለትናንሽ ፕሮጀክቶች "ትልቅ" ይመስላል (ሬይ ሰርቭ ሰነዶች) |
የሰንጠረዥ ማስታወሻ፡- “ፍሪ-ኢሽ” የሚለው ቃል የእውነተኛ ህይወት ቃል ነው። ምክንያቱም በጭራሽ ነፃ አይደለም። እንቅልፍዎ ቢሆንም እንኳ ሁልጊዜ የሆነ ቦታ ሂሳብ አለ። 😴
7) አፈጻጸም እና ልኬት - መዘግየት፣ መተላለፊያ እና እውነት 🏁
የአፈጻጸም ማስተካከያ ማለት ማሰማራት የእጅ ሥራ የሚሆንበት ቦታ ነው። ግቡ “ፈጣን” አይደለም። ግቡ በተከታታይ በቂ ፈጣን።
አስፈላጊ የሆኑ ዋና ዋና መለኪያዎች
-
p50 መዘግየት፡ የተለመደ የተጠቃሚ ተሞክሮ
-
p95 / p99 መዘግየት፡ ቁጣን የሚያመጣው ጅራት (The Thread at Scale፣ SRE መጽሐፍ፡ የተከፋፈሉ ስርዓቶችን መከታተል)
-
የመተላለፊያ ይዘት፡ በሰከንድ የሚጠየቁ ጥያቄዎች (ወይም ለጄኔሬተር ሞዴሎች በሰከንድ የሚላኩ ቶከኖች)
-
የስህተት መጠን፡ ግልጽ፣ ግን አንዳንድ ጊዜ ችላ ይባላል
-
የሀብት አጠቃቀም፡ ሲፒዩ፣ ጂፒዩ፣ ማህደረ ትውስታ፣ ቪአርኤም (SRE Book: Monitoring Distributed Systems)
ለመጎተት የተለመዱ ማንሻዎች
-
የBatching
Combine ጥያቄዎችን ያቀርባል። ለ throughput በጣም ጥሩ ነው፣ ከመጠን በላይ ካደረጉት መዘግየትን ሊጎዳ ይችላል። (Triton: Dynamic batching) -
ቁጥራዊነት
ዝቅተኛ ትክክለኛነት (እንደ INT8 ያሉ) ግምታዊነትን ሊያፋጥን እና ማህደረ ትውስታን ሊቀንስ ይችላል። ትክክለኛነትን በትንሹ ሊያዳክም ይችላል። አንዳንድ ጊዜ ግን አያስደንቅም። (ከስልጠና በኋላ ያለው መጠን) -
ማጠናቀር/ማመቻቸት
፣ የግራፍ ማመቻቻዎች፣ የ TensorRT-መሰል ፍሰቶች። ኃይለኛ፣ ግን ማረም ቅመም የበዛበት ሊሆን ይችላል 🌶️ (ONNX፣ ONNX የአሂድ ጊዜ ሞዴል ማመቻቸቶች) -
መሸጎጫ
ግብዓቶች ከተደጋገሙ (ወይም መሸጎጫ ማስገባት ከቻሉ) ብዙ መቆጠብ ይችላሉ። -
በሲፒዩ/ጂፒዩ አጠቃቀም፣ የወረፋ ጥልቀት ወይም የጥያቄ መጠን ላይ የራስ-ሰር ማመጣጠን መለኪያ። የወረፋ ጥልቀት ዝቅተኛ ደረጃ ተሰጥቶታል። ( Kubernetes HPA )
እንግዳ ነገር ግን እውነተኛ ምክር፡- እንደ የምርት መጠን መለካት። ትናንሽ የሙከራ ጭነት ይዋሻሉ። በትህትና ፈገግ ይላሉ ከዚያም በኋላ ይከዱሃል።.
8) ክትትል እና ታዛቢነት - በዓይነ ስውር አይብረሩ 👀📈
የሞዴል ክትትል ማለት የስራ ሰዓት ክትትል ብቻ አይደለም። የሚከተሉትን ማወቅ ይፈልጋሉ፦
-
አገልግሎቱ ጤናማ ነው
-
ሞዴሉ እየሰራ ነው
-
መረጃው እየተንሸራተተ ነው
-
ትንበያዎች እምነት የሚጣልባቸው እየሆኑ መጥተዋል (የVertex AI ሞዴል ክትትል አጠቃላይ እይታ፣ የአማዞን SageMaker ሞዴል ማሳያ)
ምን መከታተል እንዳለበት (ዝቅተኛው ተግባራዊ ስብስብ)
የአገልግሎት ጤና
-
የጥያቄ ብዛት፣ የስህተት መጠን፣ የዘገየ ስርጭት (SRE Book: Monitoring Distributed Systems)
-
ሙሌት (ሲፒዩ/ጂፒዩ/ማህደረ ትውስታ)
-
የወረፋው ርዝመት እና የወረፋው ጊዜ
የሞዴል ባህሪ
-
የግቤት ባህሪ ስርጭቶች (መሰረታዊ ስታቲስቲክስ)
-
የመክተት ደንቦች (ሞዴሎችን ለማካተት)
-
የውጤት ስርጭቶች (በራስ መተማመን፣ የክፍል ድብልቅ፣ የውጤት ክልሎች)
-
በግቤት ግብዓቶች ላይ ያልተለመደ ምርመራ (ቆሻሻ ማስገባት፣ ቆሻሻ ማውጣት)
የውሂብ ዝውውር እና የፅንሰ-ሀሳብ መዛባት
-
የdrift ማንቂያዎች ተግባራዊ ሊሆኑ የሚችሉ መሆን አለባቸው (Vertex AI: Monitor feature skew and drift፣ Amazon SageMaker Model Monitor)
-
አይፈለጌ መልዕክትን ከማስጠንቀቂያ ያስወግዱ - ሰዎች ሁሉንም ነገር ችላ እንዲሉ ያስተምራል
ሎግ ማድረግ፣ ግን “ሁሉንም ነገር ለዘላለም መመዝገብ” የሚለው አካሄድ አይደለም 🪵
ሎግ፡
-
የጥያቄ መታወቂያዎች
-
የሞዴል ስሪት
-
የንድፍ ማረጋገጫ ውጤቶች (OpenAPI: OpenAPI ምንድን ነው?)
-
አነስተኛ የተዋቀረ የክፍያ ጭነት ሜታዳታ (ጥሬ PII አይደለም) (NIST SP 800-122)
ስለ ግላዊነት ይጠንቀቁ። ምዝግብ ማስታወሻዎችዎ የውሂብ መፍሰስ እንዲሆኑ አይፈልጉም። (NIST SP 800-122)
9) CI/CD እና የልቀት ስልቶች - ሞዴሎችን እንደ እውነተኛ ልቀቶች ይያዙ 🧱🚦
አስተማማኝ ማሰማራት ከፈለጉ የቧንቧ መስመር ይገንቡ። ቀላል እንኳን።.
ጠንካራ ፍሰት
-
የቅድመ-ሂደት እና የድህረ-ሂደት አሃድ ሙከራዎች
-
የውህደት ሙከራ ከታወቀ የግቤት-ውጤት “ወርቃማ ስብስብ” ጋር
-
የጭነት ሙከራ መነሻ (ቀላል ክብደት ያለው እንኳን)
-
ቅርስ ይገንቡ (ኮንቴይነር + ሞዴል) (የዶከር ግንባታ ምርጥ ልምዶች)
-
ወደ መድረክ አሰማሩ
-
የካናሪ መልቀቅ ለትንሽ የትራፊክ ክፍል (ካናሪ መልቀቅ)
-
ቀስ በቀስ ወደ ላይ ከፍ ይበሉ
-
በቁልፍ ገደቦች ላይ አውቶማቲክ መልሶ ማጫወት (ሰማያዊ-አረንጓዴ ማሰማራት)
የአእምሮዎን ጤና የሚጠብቁ የህትመት ቅጦች
-
ካናሪ፡ መጀመሪያ ወደ 1-5% የትራፊክ ፍሰት ይልቀቁ (ካናሪ ልቀት)
-
ሰማያዊ-አረንጓዴ፡ አዲሱን ስሪት ከአሮጌው ጎን ያሂዱ፣ ዝግጁ ሲሆኑ ይገልብጡ (ሰማያዊ-አረንጓዴ ማሰማራት)
-
የጥላ ሙከራ፡ እውነተኛ ትራፊክ ወደ አዲሱ ሞዴል መላክ ግን ውጤቶቹን አይጠቀሙ (ለግምገማ በጣም ጥሩ) (ማይክሮሶፍት፡ የጥላ ሙከራ)
እና የመጨረሻ ነጥቦችንዎን ወይም መንገድዎን በሞዴል ስሪት ያስተካክሉ። የወደፊትን ያመሰግናሉ። የአሁኑን እርስዎም ያመሰግናሉ፣ ግን በጸጥታ።.
10) ደህንነት፣ ግላዊነት እና “እባክዎ ነገሮችን አያፈሱ” 🔐🙃
የደህንነት ሰራተኞች እንደ ያልተጋበዘ እንግዳ ዘግይተው ይመጣሉ። ቀደም ብሎ መጋበዝ የተሻለ ነው።.
ተግባራዊ የማረጋገጫ ዝርዝር
-
ማረጋገጫ እና ፈቃድ (ሞዴሉን ማን ሊጠራው ይችላል?)
-
የዋጋ ገደብ (ከአላግባብ መጠቀም እና ከአደጋ አውሎ ነፋሶች ይጠብቁ) (የኤፒአይ ጌትዌይ መዘጋት)
-
የምስጢር አስተዳደር (በኮድ ውስጥ ቁልፎች የሉም፣ በውቅረት ፋይሎች ውስጥ ቁልፎች የሉም…) (AWS Secrets Manager፣ Kubernetes Secrets)
-
የአውታረ መረብ መቆጣጠሪያዎች (የግል ንዑስ ኔት፣ የአገልግሎት-ወደ-አገልግሎት መመሪያዎች)
-
የኦዲት ምዝግብ ማስታወሻዎች (በተለይም ለስሜታዊ ትንበያዎች)
-
የውሂብ ቅነሳ (የሚያስፈልግዎትን ብቻ ያስቀምጡ) (NIST SP 800-122)
ሞዴሉ የግል መረጃን የሚነካ ከሆነ፦
-
የሃሽ መለያዎችን ቀይር ወይም አጥፋ
-
ጥሬ የክፍያ ጭነቶችን ከመመዝገብ ይቆጠቡ (NIST SP 800-122)
-
የማቆያ ደንቦችን ይግለጹ
-
የሰነድ የውሂብ ፍሰት (አሰልቺ፣ ግን መከላከያ)
እንዲሁም፣ ፈጣን መርፌ እና የውጤት አላግባብ መጠቀም ለጄኔሬቲቭ ሞዴሎች አስፈላጊ ሊሆን ይችላል። ያክሉ፦ (ለLLM አፕሊኬሽኖች ከፍተኛ 10 የOWASP፣ OWASP፦ ፈጣን መርፌ)
-
የግብዓት ማጽጃ ደንቦች
-
የውጤት ማጣሪያ ተገቢ በሚሆንበት ጊዜ
-
ለመሳሪያ ጥሪ ወይም የውሂብ ጎታ እርምጃዎች መከላከያዎች
ፍጹም የሆነ ስርዓት የለም፣ ግን ደካማ እንዲሆን ማድረግ ይችላሉ።.
11) የተለመዱ ወጥመዶች (እንደ ተለመደው ወጥመዶች) 🪤
ክላሲኮች እነሆ፡
-
የሥልጠና አገልግሎት አሰጣጥ skew
ቅድመ-ሂደት በስልጠና እና በምርት መካከል ይለያያል። በድንገት ትክክለኛነት ይቀንሳል እና ማንም ለምን እንደሆነ አያውቅም። (የ TensorFlow የውሂብ ማረጋገጫ፡ የሥልጠና አገልግሎት አሰጣጥ skewን ለይቶ ማወቅ) -
ምንም የንድፍ ማረጋገጫ የለም
አንድ የላይኛው ለውጥ ሁሉንም ነገር ይሰብራል። ሁልጊዜም ጮክ ብሎ አይደለም… (JSON Schema፣ OpenAPI: OpenAPI ምንድን ነው?) -
የጅራት መዘግየትን ችላ ማለት
p99 ተጠቃሚዎች ሲናደዱ የሚኖሩበት ቦታ ነው። (The Hill at Scale) -
መርሳት
በቤትዎ ውስጥ ያለውን እያንዳንዱን መብራት እንደመተው ነው፣ ነገር ግን አምፖሎቹ ከገንዘብ የተሠሩ ናቸው። -
የሪል እስቴት እቅድ የለም
“እንደገና እናስተካክላለን” እቅድ አይደለም። የትሮይ ካፖርት ለብሶ ተስፋ ነው። (ሰማያዊ-አረንጓዴ ማሰማራት) -
የክትትል ጊዜ ብቻ
ሞዴሉ የተሳሳተ በሚሆንበት ጊዜ አገልግሎቱ ሊሠራ ይችላል። ያ ደግሞ የከፋ ሊሆን ይችላል። (Vertex AI: Monitor feature skew and drift፣ Amazon SageMaker Model Monitor)
ይህንን እያነበቡ እና “አዎ፣ ሁለቱን እናዘጋጃለን” ብለው የሚያስቡ ከሆነ ወደ ክለቡ እንኳን በደህና መጡ። ክለቡ መክሰስ እና መለስተኛ ጭንቀት አለው። 🍪
12) ማጠቃለያ - አእምሮዎን ሳያጡ የ AI ሞዴሎችን እንዴት ማሰማራት እንደሚቻል 😄✅
ማሰማራት የ AI እውነተኛ ምርት የሚሆንበት ቦታ ነው። ማራኪ አይደለም፣ ነገር ግን እምነት የሚመነጨው እዚያ ነው።.
ፈጣን ማጠቃለያ
-
የማሰማራት ንድፍዎን መጀመሪያ ይወስኑ (በእውነተኛ ጊዜ፣ ባች፣ ዥረት፣ ጠርዝ) 🧭 (የ Amazon SageMaker Batch Transform፣ Cloud Dataflow ዥረት ሁነታዎች፣ LiteRT በመሳሪያ ላይ ያለ ማጠቃለያ)
-
የመራባት ጥቅል (ሁሉንም ነገር ያውጡ፣ ኮንቴይነሩን በኃላፊነት ይያዙት) 📦 (የዶከር ኮንቴይነሮች)
-
በአፈጻጸም ፍላጎቶች ላይ በመመስረት የማገልገል ስትራቴጂ ይምረጡ (ቀላል API ከሞዴል አገልጋይ ጋር) 🧰 (FastAPI፣ Triton: Dynamic batching)
-
አማካይን ብቻ ሳይሆን የp95/p99 መዘግየትን ይለኩ 🏁 (The Hill at Scale)
-
ለአገልግሎት ጤና እና የሞዴል ባህሪ ክትትል ያክሉ 👀 (SRE Book: Monitoring Distributed Systems, Vertex AI Model Monitoring)
-
በካናሪ ወይም በሰማያዊ-አረንጓዴ ደህንነቱ በተጠበቀ ሁኔታ ይንከባለሉ፣ እና መልሶ መመለሻውን ቀላል ያድርጉት 🚦 (ካናሪ ልቀት፣ ሰማያዊ-አረንጓዴ ማሰማራት)
-
ከመጀመሪያው ቀን ጀምሮ በደህንነት እና በግላዊነት ይጋግሩ 🔐 (የAWS ሚስጥሮች አስተዳዳሪ፣ NIST SP 800-122)
-
አሰልቺ፣ ሊገመት የሚችል እና በሰነድ የተመዘገበ ያድርጉት - አሰልቺው ውብ ነው 😌
አዎ፣ የAI ሞዴሎችን እንዴት ማሰማራት እንደሚቻል መጀመሪያ ላይ የሚንበለበሉ የቦውሊንግ ኳሶችን ማንቀሳቀስ ሊመስል ይችላል። ነገር ግን የቧንቧ መስመርዎ ከተረጋጋ በኋላ፣ በሚያስደንቅ ሁኔታ እርካታ ያስገኛል። ልክ እንደ በመጨረሻም የተዝረከረከ መሳቢያ ማደራጀት… የምርት ትራፊክ ያለው መሳቢያው ብቻ ነው።
እውነተኛ ምሳሌ፡ የድጋፍ ትኬት ትሪአንደር ሞዴልን ማሰማራት
ሁኔታ
በሳምንት 12 የድጋፍ ወኪሎች እና ወደ 900 የሚጠጉ የደንበኛ ቲኬቶች ያሉት ልብ ወለድ ግን ተጨባጭ የሆነ የSaaS ኩባንያ አስቡት። ቡድኑ የሚመጡ ቲኬቶችን በምድብ፣ በአስቸኳይ ጊዜ እና የሰው ወኪል ምላሽ ከመስጠቱ በፊት በተሰጠው አቅጣጫ ለመመደብ የAI ሞዴል ይፈልጋል።.
ይህ ሙሉ በሙሉ በራስ-ሰር የሚሰራ የድጋፍ ቦት አይደለም። ሞዴሉ ለደንበኞች ምላሾችን አይልክም። ትኬቶችን በፍጥነት ለማጓጓዝ፣ አደገኛ ጉዳዮችን ለመጠቆም እና ለወኪሎች ንጹህ የመነሻ ነጥብ ለመስጠት ይረዳል።.
እዚህ ላይ በጣም ጥሩው የማሰማሪያ ንድፍ ብዙውን ጊዜ በእውነተኛ ጊዜ የኤፒአይ ግምት። እያንዳንዱ አዲስ ቲኬት ወደ የእገዛ ዴስክ ይገባል፣ የAI አገልግሎት በጥቂት መቶ ሚሊሰከንዶች ውስጥ ያስመዘግበዋል፣ እና የእገዛ ዴስክ የተተነበየውን ምድብ፣ ቅድሚያ የሚሰጠውን፣ የእምነት ነጥብ እና የሞዴል ስሪት ያከማቻል።
ረዳቱ የሚያስፈልገው ነገር
ጠቃሚ ግብዓቶች፡
የቲኬት ርዕሰ ጉዳይ
የቲኬት አካል
የደንበኛ ዕቅድ አይነት
የመለያ ክልል
የምርት ቦታ፣ አስቀድሞ የሚታወቅ ከሆነ
ባለፉት 30 ቀናት ውስጥ የቀደሙት የቲኬት ብዛት
ጠቃሚ ህጎች፡
የግል መረጃዎችን የያዙ ከሆነ ጥሬ የደንበኛ መልዕክቶችን በጭራሽ አይመዝግቡ
የክፍያ አለመግባባቶችን፣ ህጋዊ ስጋቶችን፣ የመለያ ስረዛ ጥያቄዎችን እና የደህንነት ጉዳዮችን ለሰው ግምገማ መላክ
በራስ-ሰር የሚሄድ መንገድ ብቻ በራስ-ሰር የሚሄድበት መንገድ፣ ለምሳሌ 0.85
የሞዴሉን ስሪት ከእያንዳንዱ ትንበያ ጋር ያስቀምጡ
የሞዴል አገልግሎቱ ቀርፋፋ ወይም የማይገኝ ከሆነ በእጅ የሚደረግ ምርመራን ወደነበረበት መመለስ
የምሳሌ መመሪያ
የድጋፍ ትኬት ትሪጅ ረዳት ነዎት። እያንዳንዱን ትኬት በአንድ ምድብ ይመድቡ፡ የሂሳብ አከፋፈል፣ መግቢያ፣ የሳንካ ሪፖርት፣ የባህሪ ጥያቄ፣ የመለያ ስረዛ፣ ደህንነት ወይም ሌላ።.
ምድቡን፣ የጥድፊያ ደረጃን፣ በራስ መተማመንን ውጤት፣ አጭር ምክንያት እና የሚመከር የድጋፍ ወረፋ ይመልሱ።.
የጎደሉ እውነታዎችን አይፍጠሩ። ትኬቱ ህጋዊ፣ ደህንነት፣ የክፍያ ውድቀት፣ የመለያ ስረዛ ወይም የተናደደ የደንበኛ ቋንቋን የሚያካትት ከሆነ፣ ለሰው ግምገማ ምልክት ያድርጉበት።.
በራስ መተማመን ከ0.85 በታች ከሆነ፣ “በእጅ ግምገማ” የሚለውን እንደ ተመከረው ወረፋ ይመልሱ።.
የምሳሌ ውጤት
ደካማ ውጤት;
ምድብ፡ የሳንካ
ቅድሚያ፡ ከፍተኛ
ወደ ድጋፍ ላክ።
የተሻለ ውጤት፦
ምድብ፡ የመግቢያ
አስቸኳይነት፡ መካከለኛ
በራስ መተማመን፡ 0.91
የሚመከር ወረፋ፡ የመለያ መዳረሻ
ምክንያት፡ ደንበኛው የይለፍ ቃሉን ዳግም ካስጀመረ በኋላ መለያውን መድረስ አይችልም። የደህንነት ስጋት ወይም የክፍያ ችግር አልተጠቀሰም።
የሰው ግምገማ አያስፈልግም፡ የለም
የሞዴል ስሪት፡ ticket-triage-v1.3
የተሻለ ውጤት ኦዲት ለማድረግ ቀላል ነው ምክንያቱም የመተማመን ነጥብ፣ የማዞሪያ ውሳኔ፣ ምክንያት እና የሞዴል ስሪትን ያካትታል።.
እንዴት እንደሚፈትሹት
ወደ ሞዴሉ የቀጥታ ትራፊክ ከመላክዎ በፊት፣ እውነተኛ ግን ስም-አልባ የሆኑ ትናንሽ “ወርቃማ ስብስቦች” ይፍጠሩ።.
ቀላል የሙከራ ስብስብ የሚከተሉትን ሊያካትት ይችላል-
50 የክፍያ ቲኬቶች
50 የመግቢያ ቲኬቶች
50 የሳንካ ሪፖርቶች
30 የስረዛ ጥያቄዎች
20 ለደህንነት ስሜታዊ የሆኑ ቲኬቶች
20 ግራ የሚያጋቡ ወይም የተደባለቁ ምድቦች ትኬቶች
ከዚያም የሚከተለውን ያረጋግጡ፦
ሞዴሉ ከሰው ገምጋሚ ጋር ተመሳሳይ ምድብ ይመርጣል?
የደህንነት፣ የህግ እና የስረዛ ትኬቶችን በትክክል ያባብሳል?
በራስ መተማመን ዝቅተኛ ሲሆን "በእጅ ግምገማ" ይመልሳል?
የp95 መዘግየት በቡድኑ ኢላማ ስር ይቆያል?
ሞዴሉ በማይገኝበት ጊዜ አገልግሎቱ ደህንነቱ በተጠበቀ ሁኔታ ይቋረጣል?
ለመልቀቅ፣ መጀመሪያ የጥላ ሙከራ ይጠቀሙ። እውነተኛ ቲኬቶችን ወደ አዲሱ ሞዴል ይላኩ፣ ነገር ግን ትንበያዎቹን እስካሁን አይጠቀሙ። ውጤቱን ከመደበኛ የሰው ልጅ ትራያጅ ጋር ለጥቂት ቀናት ያወዳድሩ። ውጤቶቹ የተረጋጉ ከሆኑ፣ ወደ 5% የካናሪ ልቀት፣ ከዚያ 25%፣ ከዚያ 100% ይሂዱ።.
ውጤት
የስራ ፍሰቱን ከመጠቀም በፊት እና በኋላ 100 የናሙና ቲኬቶችን በጊዜ ላይ በመመስረት ምሳሌያዊ ውጤት፡
በእጅ የሚደረግ የፈተና ጊዜ ከ6 ደቂቃ በአንድ ቲኬት ወደ 1 ደቂቃ በአንድ ቲኬት 40 ሰከንድ ቀንሷል
ቡድኑ በ100 ቲኬቶች ላይ 7.2 ሰዓታት ያህል ቆጥቧል
ከሰው ገምጋሚ ጋር የተደረገው የምድብ ስምምነት በ220-ቲኬት የወርቅ ስብስብ ውስጥ 87% ደርሷል።
ከ20ቱ የደህንነት ስጋት ያለባቸው የፈተና ትኬቶች 100% ወደ ሰው ግምገማ ተሻሽለዋል
p95 መዘግየት በምርት-መሰል ክፍያዎች ላይ 480 ms ነበር
የp99 መዘግየት 910 ሚሴ ነበር
የድሮው ሞዴል የመጨረሻ ነጥብ በካናሪ ልቀት ወቅት በቀጥታ ስለቀጠለ የመልሶ ማጫወት ጊዜ ከ2 ደቂቃዎች በታች ነበር
እነዚህ ቁጥሮች ሁለንተናዊ መለኪያዎች አይደሉም። እነዚህ መለኪያዎች አንድ ቡድን የክትትል ተግባራትን በጊዜ በመወሰን፣ ትንበያዎችን ከተሰየመ የሙከራ ስብስብ ጋር በማወዳደር እና የመጨረሻውን ነጥብ ከእውነተኛ የቲኬት ክፍያዎች ጋር በመጫን ሊደግማቸው የሚችላቸው የምሳሌ መለኪያዎች ናቸው።.
ምን ሊበላሽ ይችላል
ትልቁ አደጋ ሞዴሉን ከመጠን በላይ ማመን ነው። “ዝቅተኛ አጣዳፊነት” የሚል ምልክት የተደረገበት ትኬት አሁንም ከባድ የደህንነት ችግርን ሊያካትት ይችላል፣ በተለይም ደንበኛው ግልጽ ባልሆነ መንገድ የሚጽፍ ከሆነ።.
ሌሎች የተለመዱ ስህተቶች፡
ከእውነተኛ የደንበኛ ቲኬቶች ጋር የማይዛመዱ የተወለወለ የሙከራ ቲኬቶችን መጠቀም
የግል መረጃዎችን በመጠቀም ሙሉ የደንበኛ መልዕክቶችን መመዝገብ
የሞዴሉን ስሪት ከእያንዳንዱ ትንበያ ጋር አለማከማቸት
በራስ መተማመን ዝቅተኛ ቢሆንም እንኳ እያንዳንዱን ትኬት በራስ-ሰር ማዞር
በእጅ የሚደረግ የመውደቅ ወረፋ መርሳት
አማካይ መዘግየትን መለካት ነገር ግን p95 እና p99ን ችላ ማለት
የድጋፍ ቡድኑ ወረፋውን ከቀየረ በኋላ የድሮ ምድቦች በሞዴሉ ውስጥ እንዲቆዩ መፍቀድ
ተግባራዊ የመውሰጃ ጊዜ
ጥሩ የAI ማሰማራት ትልቅ መጀመር የለበትም። በአንድ ጠባብ የስራ ፍሰት፣ በአንድ ግልጽ በይነገጽ፣ በአንድ ወርቃማ የሙከራ ስብስብ እና በአንድ ደህንነቱ የተጠበቀ የመልሶ መመለሻ መንገድ ይጀምሩ። ሞዴሉ አደጋን ሳይደብቅ ጊዜን የሚቆጥብ ከሆነ፣ ሊሰፋ የሚችል ማሰማራት ይኖርዎታል።.
ተደጋጋሚ ጥያቄዎች
በምርት ውስጥ የ AI ሞዴልን ማሰማራት ምን ማለት ነው?
የAI ሞዴልን ማሰማራት ብዙውን ጊዜ የትንበያ ኤፒአይን ከማጋለጥ የበለጠ ነገርን ያካትታል። በተግባር፣ ሞዴሉን እና ጥገዶቹን ማሸግ፣ የማቅረቢያ ንድፍ (በእውነተኛ ጊዜ፣ ባች፣ ዥረት ወይም ጠርዝ) መምረጥ፣ በአስተማማኝነት መመጠን፣ ጤናን እና መንሸራተትን መከታተል እና ደህንነቱ የተጠበቀ የልቀት እና የመመለሻ መንገዶችን ማዘጋጀትን ያካትታል። ጠንካራ ማሰማራት በጭነት ስር በሚገመት ሁኔታ የተረጋጋ ሆኖ ይቆያል እና የሆነ ነገር ሲበላሽ ሊታወቅ የሚችል ሆኖ ይቆያል።.
በእውነተኛ ጊዜ፣ ባች፣ ዥረት ወይም ጠርዝ ማሰማራት መካከል እንዴት እንደሚመረጥ
ትንበያዎች በሚያስፈልጉበት ጊዜ እና በሚተዳደሩባቸው ገደቦች ላይ በመመስረት የማሰማሪያ ስርዓቱን ይምረጡ። የእውነተኛ ጊዜ ኤፒአይዎች መዘግየት አስፈላጊ በሚሆንበት ጊዜ በይነተገናኝ ልምዶችን ያሟላሉ። የቡድን ውጤት አሰጣጥ መዘግየቶች ተቀባይነት ያላቸው እና የወጪ ቆጣቢነት መሪዎች ሲሆኑ በተሻለ ሁኔታ ይሰራል። ዥረት መልቀቅ ለቀጣይ የዝግጅት ሂደት ተስማሚ ነው፣ በተለይም የማድረስ ትርጉሞች አስቸጋሪ ሲሆኑ። የጠርዝ ማሰማራት ከመስመር ውጭ ክወና፣ ግላዊነት ወይም እጅግ በጣም ዝቅተኛ መዘግየት መስፈርቶች ተስማሚ ነው፣ ምንም እንኳን ዝማኔዎች እና የሃርድዌር ልዩነቶች ለማስተዳደር አስቸጋሪ ቢሆኑም።.
"በላፕቶፑ ላይ ይሰራል" የሚለውን የስርጭት ውድቀቶችን ለማስወገድ ምን እንደሚደረግ
ከሞዴል ክብደቶች በላይ ስሪት። በተለምዶ፣ የተቀረጸ የሞዴል ቅርስ (ቶከነዘሮችን ወይም የመለያ ካርታዎችን ጨምሮ)፣ ቅድመ-ሂደት እና የባህሪ አመክንዮ፣ የግምታዊ ኮድ እና ሙሉ የሩጫ ጊዜ አካባቢ (ፓይዘን/CUDA/ስርዓት ቤተ-መጻሕፍት) ያስፈልግዎታል። ሞዴሉን እንደ የልቀት ቅርስ አድርገው በመለያ የተሰጡ ስሪቶች እና ቀላል ክብደት ያለው ሜታዳታ በመጠቀም የንድፍ ግምቶችን፣ የግምገማ ማስታወሻዎችን እና የሚታወቁ ገደቦችን የሚገልጽ።.
በቀላል የFastAPI አይነት አገልግሎት ወይም በተወሰነ የሞዴል አገልጋይ ለማሰማራት ይሁን
ቀላል የመተግበሪያ አገልጋይ (የFastAPI አይነት አቀራረብ) ለቀደምት ምርቶች ወይም ቀጥተኛ ሞዴሎች በጥሩ ሁኔታ ይሰራል ምክንያቱም በማዞሪያ፣ በፈቃድ እና በውህደት ላይ ቁጥጥር ስለሚኖርዎት። የሞዴል አገልጋይ (TorchServe ወይም NVIDIA Triton-style) ጠንካራ የባችኪንግ፣ የእኩልነት እና የጂፒዩ ቅልጥፍናን ከሳጥኑ ውጭ ሊያቀርብ ይችላል። ብዙ ቡድኖች በሃይብሪድ ላይ ይወድቃሉ፡ ለግምታዊ ሞዴል አገልጋይ እና ለፈቃድ፣ ለጥያቄ ቅርፅ እና ለደረጃ ገደቦች ቀጭን የኤፒአይ ንብርብር።.
ትክክለኛነትን ሳይጥሱ መዘግየትን እና አፈጻጸምን እንዴት ማሻሻል እንደሚቻል
ትናንሽ ሙከራዎች ሊያሳስቱ ስለሚችሉ በምርት መሰል ሃርድዌር ላይ የp95/p99 መዘግየትን በመለካት ይጀምሩ፣ ምክንያቱም ትናንሽ ሙከራዎች ሊያሳስቱ ይችላሉ። የተለመዱ ማንሻዎች ባችኪንግ (የተሻለ የመተላለፊያ ይዘት፣ የከፋ መዘግየት)፣ ኳንቲዜሽን (አነስተኛ እና ፈጣን፣ አንዳንድ ጊዜ መጠነኛ ትክክለኛነት ያላቸው ልውውጦች)፣ ማጠናቀር እና የማመቻቸት ፍሰቶች (ONNX/TensorRT-like) እና ተደጋጋሚ ግብዓቶችን ወይም ኢምቤዲንግዎችን መሸጎጫ ያካትታሉ። በወረፋ ጥልቀት ላይ የተመሠረተ ራስ-ሰር ማመጣጠን የጅራት መዘግየት ወደ ላይ እንዳይወጣ ሊያደርግ ይችላል።.
ከ"መጨረሻው ነጥብ በላይ ነው" ባሻገር ምን አይነት ክትትል ያስፈልጋል
የአገልግሎት ሰዓት በቂ አይደለም፣ ምክንያቱም አንድ አገልግሎት የትንበያ ጥራት ሲሸረሸር ጤናማ ሊመስል ይችላል። ቢያንስ የጥያቄ መጠንን፣ የስህተት ፍጥነትን እና የዘገየ መዘግየትን እንዲሁም እንደ ሲፒዩ/ጂፒዩ/ማህደረ ትውስታ እና የወረፋ ጊዜ ያሉ የሙሌት ምልክቶችን ይከታተሉ። ለሞዴል ባህሪ፣ የግብዓት እና የውጤት ስርጭቶችን ከመሠረታዊ ያልተለመዱ ምልክቶች ጋር ይከታተሉ። ጫጫታ ከማስጠንቀቂያዎች ይልቅ እርምጃን የሚቀሰቅሱ የመንሸራተት ፍተሻዎችን እና የምዝግብ ማስታወሻ ጥያቄ መታወቂያዎችን፣ የሞዴል ስሪቶችን እና የንድፍ ማረጋገጫ ውጤቶችን ያክሉ።.
አዳዲስ የሞዴል ስሪቶችን ደህንነቱ በተጠበቀ ሁኔታ እንዴት መልቀቅ እና በፍጥነት ማገገም እንደሚቻል
ሞዴሎችን እንደ ሙሉ ልቀት አድርገው ይይዟቸው፣ ቅድመ-ሂደትን እና ድህረ-ሂደትን የሚፈትሽ የCI/CD ቧንቧ መስመር፣ የውህደት ፍተሻዎችን ከ"ወርቃማ ስብስብ" ጋር ያካሂዳል እና የጭነት መሰረትን ያቋቁማል። ለመልቀቂያዎች፣ ካናሪ የራምፕ ትራፊክን ቀስ በቀስ ይለቃል፣ ሰማያዊ-አረንጓዴ ደግሞ አሮጌውን ስሪት ወዲያውኑ ለመውደቅ በቀጥታ ያቆያል። የጥላ ሙከራ ተጠቃሚዎችን ሳይነካ በእውነተኛ ትራፊክ ላይ አዲስ ሞዴል ለመገምገም ይረዳል። ጥቅልል ማድረግ የመጀመሪያ ደረጃ ዘዴ መሆን አለበት፣ በኋላ ላይ የታሰበ አይደለም።.
የ AI ሞዴሎችን እንዴት ማሰማራት እንደሚቻል ሲማሩ በጣም የተለመዱ ወጥመዶች
የሥልጠና አገልግሎት አሰጣጥ ስተት ክላሲክ ጉዳይ ነው፡ ቅድመ-ሂደት በስልጠና እና በምርት መካከል ይለያል፣ እና አፈፃፀሙ በጸጥታ ይቀንሳል። ሌላው ተደጋጋሚ ችግር የንድፍ ማረጋገጫ አለመኖር ነው፣ የላይኛው ለውጥ ግብዓቶችን በስውር መንገዶች የሚሰብርበት። ቡድኖች የጅራት መዘግየትን እና በአማካዮች ላይ ከመጠን በላይ ማተኮርን አቅልለው ይመለከቱታል፣ ወጪን ችላ ይላሉ (ስራ ፈት ጂፒዩዎች በፍጥነት ይጨምራሉ) እና የመልሶ ማጫወት እቅድን ይዘላሉ። የስራ ሰዓትን ብቻ መከታተል በተለይ አደገኛ ነው፣ ምክንያቱም “ወደላይ ግን የተሳሳተ” ከውድቀት የባሰ ሊሆን ይችላል።.
ማጣቀሻዎች
-
የአማዞን ድር አገልግሎቶች (AWS) - Amazon SageMaker: በእውነተኛ ጊዜ የተገኘ መደምደሚያ - docs.aws.amazon.com
-
የአማዞን ድር አገልግሎቶች (AWS) - የአማዞን ሳጅሜከር ባች ትራንስፎርም - docs.aws.amazon.com
-
የአማዞን ድር አገልግሎቶች (AWS) - የአማዞን ሳጅሜከር ሞዴል ሞኒተር - docs.aws.amazon.com
-
የአማዞን ድር አገልግሎቶች (AWS) - የኤፒአይ ጌትዌይ ጥያቄ መጨናነቅ - docs.aws.amazon.com
-
የአማዞን ድር አገልግሎቶች (AWS) - የAWS ሚስጥሮች አስተዳዳሪ፡ መግቢያ - docs.aws.amazon.com
-
የአማዞን ድር አገልግሎቶች (AWS) - AWS የላምዳ አፈፃፀም አካባቢ የህይወት ዑደት - docs.aws.amazon.com
-
ጉግል ክላውድ - Vertex AI፡ ሞዴልን ወደ መጨረሻ ነጥብ ያሰማሩ - docs.cloud.google.com
-
የጉግል ክላውድ - የቨርቴክስ ኤአይ ሞዴል ክትትል አጠቃላይ እይታ - docs.cloud.google.com
-
ጉግል ክላውድ - Vertex AI: የማሳያ ባህሪ ስዌም ኤንድ ድሪፍ - docs.cloud.google.com
-
የጉግል ክላውድ ጦማር - የውሂብ ፍሰት፡ በትክክል-አንድ ጊዜ እና ቢያንስ-አንድ ጊዜ የዥረት ሁነታዎች - cloud.google.com
-
ጉግል ክላውድ - የደመና የውሂብ ፍሰት ዥረት ሁነታዎች - docs.cloud.google.com
-
የጉግል ኤስአርኢ መጽሐፍ - የተከፋፈሉ ስርዓቶችን መከታተል - sre.google
-
የጉግል ምርምር - ጅራቱ በስኬል - research.google
-
LiteRT (Google AI) - LiteRT አጠቃላይ እይታ - ai.google.dev
-
LiteRT (Google AI) - LiteRT በመሣሪያ ላይ ፍንጭ - ai.google.dev
-
ዶከር - ኮንቴይነር ምንድን ነው? - docs.docker.com
-
Docker - የDocker ግንባታ ምርጥ ልምዶች - docs.docker.com
-
ኩበርኔትስ - የኩበርኔትስ ሚስጥሮች - kubernetes.io
-
Kubernetes - Horizontal Pod Autoscaling - kubernetes.io
-
ማርቲን ፎውለር - የካናሪ ልቀት - martinfowler.com
-
ማርቲን ፎውለር - ሰማያዊ-አረንጓዴ ማሰማራት - martinfowler.com
-
የOpenAPI ተነሳሽነት - OpenAPI ምንድን ነው? - openapis.org
-
JSON Schema - (በጣቢያው ላይ የተጠቀሰው) - json-schema.org
-
የፕሮቶኮል ባፈሮች - የፕሮቶኮል ባፈሮች አጠቃላይ እይታ - protobuf.dev
-
FastAPI - (በጣቢያው ላይ የተጠቀሰው) - fastapi.tiangolo.com
-
NVIDIA - Triton: ተለዋዋጭ ባቺንግ እና ኮንኮርንታል ሞዴል አተገባበር - docs.nvidia.com
-
NVIDIA - Triton: Concurrent Model Execution - docs.nvidia.com
-
NVIDIA - ትሪቶን ኢንፈረንስ ሰርቨር ሰነዶች - docs.nvidia.com
-
PyTorch - TorchServe docs - docs.pytorch.org
-
BentoML - ለማሰማራት የሚያገለግል ማሸጊያ - docs.bentoml.com
-
ሬይ - ሬይ ሰርቭ docs - docs.ray.io
-
TensorFlow - የድህረ-ስልጠና መጠን (TensorFlow ሞዴል ማሻሻያ) - tensorflow.org
-
TensorFlow - TensorFlow የውሂብ ማረጋገጫ፡ የሥልጠና አገልግሎት ሰጪ ስኬል ያግኙ - tensorflow.org
-
ONNX - (በጣቢያው ላይ የተጠቀሰው) - onnx.ai
-
ONNX የሩጫ ጊዜ - የሞዴል ማሻሻያዎች - onnxruntime.ai
-
NIST (ብሔራዊ የደረጃዎች እና የቴክኖሎጂ ተቋም) - NIST SP 800-122 - csrc.nist.gov
-
arXiv - የሞዴል ሪፖርት ለማድረግ የሞዴል ካርዶች - arxiv.org
-
ማይክሮሶፍት - የጥላ ሙከራ - microsoft.github.io
-
OWASP - OWASP ለ LLM አፕሊኬሽኖች 10 ምርጥ - owasp.org
-
OWASP GenAI የደህንነት ፕሮጀክት - OWASP: ፈጣን መርፌ - genai.owasp.org