አጭር መልስ ፡ የAI ማራዘሚያ ሞዴልን በተጣመሩ ዝቅተኛ እና ከፍተኛ ጥራት ባላቸው ምስሎች ላይ በማሰልጠን ይሰራል፣ ከዚያም በማሳደግ ጊዜ ሊታመኑ የሚችሉ ተጨማሪ ፒክስሎችን ለመተንበይ ይጠቀምበታል። ሞዴሉ በስልጠና ወቅት ተመሳሳይ ሸካራነቶችን ወይም ፊቶችን ካየ፣ አሳማኝ ዝርዝሮችን ሊጨምር ይችላል፤ ካልሆነ ግን እንደ ሃሎስ፣ ሰም የሚመስል ቆዳ ወይም በቪዲዮ ላይ ብልጭ ድርግም የሚሉ ቅርሶችን "ሊያስመስል" ይችላል።
ቁልፍ ነጥቦች፡
ትንበያ ፡ ሞዴሉ ተጨባጭ ዝርዝር ነገር ያመነጫል፣ የተረጋገጠ የእውነታ መልሶ ግንባታ አይደለም።
የሞዴል ምርጫ ፡ ሲኤንኤንዎች የበለጠ የተረጋጋ ናቸው፤ ጂኤንኤዎች የበለጠ ጥራት ያላቸው ሊመስሉ ይችላሉ ነገር ግን ባህሪያትን የመፍጠር አደጋ ላይ ሊጥሉ ይችላሉ።
የቅርስ ፍተሻዎች ፡- ሃሎዎችን፣ ተደጋጋሚ ሸካራነቶችን፣ “ከሞላ ጎደል ፊደላት” እና ፕላስቲክ የሚመስሉ ፊቶችን ይመልከቱ።
የቪዲዮ መረጋጋት ፡- ጊዜያዊ ዘዴዎችን ይጠቀሙ አለበለዚያ ከፍሬም-ወደ-ፍሬም የሚያብረቀርቅ እና የሚያንሸራተት ያያሉ።
ከፍተኛ ጥንቃቄ የተሞላበት አጠቃቀም ፡- ትክክለኛነት አስፈላጊ ከሆነ፣ ሂደቱን ይፋ ያድርጉ እና ውጤቶቹን እንደ ምሳሌ ይቁጠሩ።

ምናልባት አይተውት ይሆናል፡ ትንሽ፣ ጥርት ያለ ምስል ሳይሸበር ለማተም፣ ለመልቀቅ ወይም ወደ አቀራረብ ለመጣል የሚያስችል ጥርት ያለ ነገር ይሆናል። እንደ ማጭበርበር ይሰማዋል። እና - በተሻለ መንገድ - በሆነ መልኩ 😅 ነው
ስለዚህ፣ የAI አፕስኬሊንግ እንዴት እንደሚሰራ ከ"ኮምፒዩተሩ ዝርዝሮችን ያሻሽላል" (በእጅ የሚወዛወዝ) የበለጠ ግልጽ በሆነ ነገር ላይ የተመሠረተ እና ወደ "ሞዴል ከብዙ ምሳሌዎች በተማረው ቅጦች ላይ ተመስርቶ ሊታመን የሚችል ከፍተኛ ጥራት ያለው መዋቅርን ይተነብያል" ( Deep Learning for Image Super-resolution: A Survey ) ቅርብ ነው። ያ የትንበያ ደረጃ ሙሉው ጨዋታ ነው - ለዚህም ነው የAI አፕስኬሊንግ አስደናቂ ሊመስል የሚችለው… ወይም ትንሽ ፕላስቲክ… ወይም ድመትዎ እንደ ጉርሻ ጢም ያደገ።
ከዚህ ጽሑፍ በኋላ ሊያነቧቸው የሚችሏቸው ጽሑፎች፡
🔗 የአይአይ (AI) እንዴት እንደሚሰራ
በ AI ውስጥ የሞዴሎችን፣ የውሂብ እና የመደምደሚያ መሰረታዊ ነገሮችን ይወቁ።.
🔗 የ AI ትምህርት እንዴት እንደሚማር
የሥልጠና መረጃዎች እና ግብረመልሶች ከጊዜ ወደ ጊዜ የሞዴል አፈጻጸምን እንዴት እንደሚያሻሽሉ ይመልከቱ።.
🔗 AI ያልተለመዱ ነገሮችን እንዴት እንደሚለይ
የንድፍ መሰረታዊ ነገሮችን እና AI ያልተለመደ ባህሪን በፍጥነት እንዴት እንደሚጠቁም ይረዱ።.
🔗 እንዴት AI አዝማሚያዎችን እንደሚተነብይ
ምልክቶችን የሚለዩ እና የወደፊት ፍላጎትን የሚጠብቁ የትንበያ ዘዴዎችን ያስሱ።.
የ AI ማበልጸጊያ እንዴት እንደሚሰራ፡- በዕለት ተዕለት ቃላት ዋናው ሀሳብ 🧩
ማባዛት ማለት ጥራትን ማሳደግ ማለት ነው፡- ተጨማሪ ፒክስሎች፣ ትልቅ ምስል። ባህላዊ ማባዛት (እንደ ቢኩቢክ) በመሠረቱ ፒክስሎችን ዘርግቶ ሽግግሮችን ያቀላጥፋል ( ቢኩቢክ ኢንተርፖሌሽን አዲስ መፍጠር አይችልም - ማባዛት ብቻ ነው።
የ AI ማሻሻያ (Upscaling) የበለጠ ደፋር የሆነ ነገር (በምርምር ዓለም ውስጥ "super-resolution" በመባልም ይታወቃል) ይሞክራል ( Deep Learning for Image Super-resolution: A Survey ):
-
ዝቅተኛ ጥራት ያለው ግብዓትን ይመለከታል
-
ቅጦችን (ጠርዞችን፣ ሸካራነቶችን፣ የፊት ገጽታዎችን፣ የጽሑፍ ምልክቶችን፣ የጨርቅ ሽመናን...) ያውቃል
-
ከፍተኛ ጥራት ያለው ስሪት ምን መምሰል እንዳለበት ይተነብያል
-
ለእነዚያ ቅጦች የሚስማማ ተጨማሪ የፒክሰል ውሂብ ያመነጫል
"እውነታውን በትክክል ወደነበረበት መመለስ" አይደለም፣ ይልቁንም "በጣም አሳማኝ ግምት ማድረግ" ( Deep Convolutional Networks Using Image Super-Resolution (SRCNN) )። ያ ትንሽ አጠራጣሪ የሚመስል ከሆነ፣ አልተሳሳቱም - ግን በጥሩ ሁኔታ የሚሰራው ለዚህ ነው 😄
እና አዎ፣ ይህ ማለት የ AI ማራዘሚያ በመሠረቱ ቁጥጥር የሚደረግበት ቅዠት ነው ማለት ነው… ነገር ግን ውጤታማ በሆነ፣ ፒክስልን በሚያከብር መንገድ።.
ጥሩ የAI ማሻሻያ ስሪት የሚያደርገው ምንድን ነው? ✅🛠️
የ AI አፕሌስፐር (ወይም የቅንብሮች ቅድመ-ቅምጥ) እየገመገሙ ከሆነ፣ በጣም አስፈላጊው ነገር ይኸውና፡
-
ከመጠን በላይ ሳይበስል የዝርዝር መልሶ ማግኛ
ጥሩ የማሳደግ ችሎታ ጥርት ያለ እና መዋቅርን ይጨምራል፣ ጥርት ያለ ድምፅ ወይም የውሸት ቀዳዳዎችን አያካትትም። -
የጠርዝ ዲሲፕሊን
ንፁህ መስመሮች ንፁህ ሆነው ይቆያሉ። መጥፎ ሞዴሎች ጠርዞቹን እንዲወዛወዙ ወይም እንዲያብቡ ያደርጋቸዋል። -
የሸካራነት እውነታዊነት
ፀጉር የቀለም ብሩሽ መሆን የለበትም። ጡብ የሚደጋገም የንድፍ ማህተም መሆን የለበትም። -
የድምፅ እና የመጨመቂያ አያያዝ
ብዙ የዕለት ተዕለት ምስሎች JPEG ይሞታሉ። ጥሩ የማሳደጊያ መሳሪያ ያንን ጉዳት አያባብሰውም ( Real-ESRGAN )። -
የፊት እና የጽሑፍ ግንዛቤ
ፊቶች እና ጽሑፎች ስህተቶችን ለመለየት በጣም ቀላሉ ቦታዎች ናቸው። ጥሩ ሞዴሎች በቀስታ ይይዟቸዋል (ወይም ልዩ ሁነታዎች አሏቸው)። -
በክፈፎች መካከል ወጥነት (ለቪዲዮ)
ዝርዝሩ ፍሬም-ወደ-ፍሬም ብልጭ ድርግም ካለ፣ ዓይኖችዎ ይጮኻሉ። ቪዲዮ በጊዜያዊ መረጋጋት ህይወትን ያሳድጋል ወይም ይሞታል ( BasicVSR (CVPR 2021) )። -
ትርጉም የሚሰጡ መቆጣጠሪያዎች
ከእውነተኛ ውጤቶች ጋር የሚዛመዱ ተንሸራታቾችን ይፈልጋሉ፡- ዲኖይዝ፣ ዲብሎር፣ ቅርስ ማስወገድ፣ የእህል ማቆየት፣ ሹል ማድረግ… ተግባራዊ ነገሮች።
ጸጥ ያለ ሕግ፡- “ምርጡ” የማሳደግ ችሎታ ብዙውን ጊዜ በቀላሉ የማያስተውሉት ነው። መጀመሪያ ላይ የተሻለ ካሜራ ያለዎት ይመስላል 📷✨
የንፅፅር ሰንጠረዥ፡ ታዋቂ የ AI ማሻሻያ አማራጮች (እና ለምን ጥሩ እንደሆኑ) 📊🙂
ከዚህ በታች ተግባራዊ ንጽጽር አለ። ዋጋዎች ሆን ተብሎ ግልጽ ያልሆኑ ናቸው ምክንያቱም መሳሪያዎች በፈቃድ፣ በጥቅል፣ በሂሳብ ስሌት እና በሌሎች አስደሳች ነገሮች ይለያያሉ።.
| መሳሪያ / አቀራረብ | ለ ምርጥ | የዋጋ ስሜት | ለምን እንደሚሰራ (በግምት) |
|---|---|---|---|
| የቶፓዝ አይነት የዴስክቶፕ ማራገቢያዎች ( ቶፓዝ ፎቶ ፣ ቶፓዝ ቪዲዮ ) | ፎቶዎች፣ ቪዲዮዎች፣ ቀላል የስራ ፍሰት | የተከፈለበት | ጠንካራ አጠቃላይ ሞዴሎች + ብዙ ማስተካከያዎች፣ “ልክ ይሰራሉ”… በአብዛኛው |
| የAdobe “Super Resolution” አይነት ባህሪያት ( Adobe Enhance > Super Resolution ) | ፎቶግራፍ አንሺዎች አስቀድመው በዚያ ሥነ-ምህዳር ውስጥ ነበሩ | የደንበኝነት ምዝገባ-y | ጠንካራ የዝርዝር መልሶ ግንባታ፣ ብዙውን ጊዜ ወግ አጥባቂ (ያነሰ ድራማ) |
| የእውነተኛ-ESRGAN / የESRGAN ልዩነቶች ( እውነተኛ-ESRGAN ፣ ESRGAN ) | እራስዎ ያድርጉት፣ ገንቢዎች፣ የባች ስራዎች | ነፃ (ግን ጊዜ የሚወስድ) | በሸካራነት ዝርዝሮች በጣም ጥሩ ነው፣ ጥንቃቄ ካላደረጉ በፊቶች ላይ ቅመም የበዛበት ሊሆን ይችላል |
| በስርጭት ላይ የተመሰረቱ የማሳደግ ሁነታዎች ( SR3 ) | የፈጠራ ስራ፣ በቅጥ የተሰሩ ውጤቶች | የተቀላቀለ | የሚያምሩ ዝርዝሮችን መፍጠር ይችላል - እንዲሁም ከንቱ ነገሮችን መፍጠር ይችላል፣ ስለዚህ… አዎ |
| የጨዋታ ማራዘሚያዎች (DLSS/FSR-style) ( NVIDIA DLSS ፣ AMD FSR 2 ) | በእውነተኛ ጊዜ የሚደረግ ጨዋታ እና አተረጓጎም | በጥቅል የቀረበ | የእንቅስቃሴ ውሂብን እና የተማሩ ቅድመ-ግምቶችን ይጠቀማል - ለስላሳ የአፈጻጸም ድል 🕹️ |
| የደመና ማበልጸጊያ አገልግሎቶች | ምቾት፣ ፈጣን ድል | ክፍያ-በ-አጠቃቀም | ፈጣን + ሊሰፋ የሚችል፣ ግን ቁጥጥርን እና አንዳንድ ጊዜ ረቂቅነትን ይገበያያሉ |
| በቪዲዮ ላይ ያተኮሩ የAI ማራዘሚያዎች ( BasicVSR ፣ Topaz Video ) | የድሮ ቀረጻ፣ አኒሜ፣ ማህደሮች | የተከፈለበት | ብልጭ ድርግም የሚሉ ቪዲዮዎችን ለመቀነስ ጊዜያዊ ዘዴዎች + ልዩ የቪዲዮ ሞዴሎች |
| "ስማርት" ስልክ/ጋለሪ ማበልጸጊያ | ለተለመደ አጠቃቀም | ተካትቷል | ለደስታ ውጤት የተስተካከሉ ቀላል ክብደት ያላቸው ሞዴሎች፣ ፍጹምነት የሌላቸው (አሁንም ምቹ ናቸው) |
የኪርክ ኑዛዜን መቅረጽ፡ “ክፍያ-ኢሽ” በዚያ ሰንጠረዥ ውስጥ ብዙ ስራ እየሰራ ነው። ግን ሀሳቡን ተረድተሃል 😅
ትልቁ ሚስጥር፡ ሞዴሎች ከዝቅተኛ-ሪዝ ወደ ከፍተኛ-ሪዝ ካርታ መማር 🧠➡️🖼️
በአብዛኛዎቹ የ AI ማሻሻያ እምብርት ላይ ቁጥጥር የሚደረግበት የመማሪያ ማዋቀር ነው ( ምስል ልዕለ-ጥራትን በመጠቀም ጥልቅ ኮንቮሽናል ኔትወርኮች (SRCNN) )
-
በከፍተኛ ጥራት ምስሎች (“እውነት”) ይጀምሩ
-
ወደ ዝቅተኛ ጥራት ያላቸው ስሪቶች (“ግብዓት”) ዝቅ አድርገው ይምሯቸው
-
የመጀመሪያውን ከፍተኛ ጥራት ከዝቅተኛ ጥራት መልሶ ለመገንባት ሞዴልን ያሠለጥኑ
ከጊዜ በኋላ ሞዴሉ የሚከተሉትን ግንኙነቶች ይማራል፡
-
"በዓይን ዙሪያ ያለው እንዲህ ዓይነቱ ብዥታ ብዙውን ጊዜ የዐይን ሽፋሽፍት ነው"
-
"ይህ የፒክሰል ክላስተር ብዙውን ጊዜ የሴሪፍ ጽሑፍን ያመለክታል"
-
"ይህ የጠርዝ ቅልመት እንደ ጣሪያ መስመር ይመስላል፣ የዘፈቀደ ድምፅ አይደለም"
የተወሰኑ ምስሎችን ማስታወስ አይደለም (በቀላል አነጋገር)፣ የስታቲስቲክስ መዋቅርን መማር ነው ( ለምስል ጥልቅ ትምህርት ልዕለ-ጥራት፡ የዳሰሳ ጥናት )። የሸካራነቶችን እና የጠርዞችን ሰዋሰው መማርን እንደመማር አስቡት። የግጥም ሰዋሰው አይደለም፣ ልክ እንደ… የ IKEA የእጅ ሰዋሰው 🪑📦 (የተዛባ ዘይቤ፣ ግን በቂ ቅርብ)።
ለውጦቹ እና ብልቶቹ፡ በማጠቃለያ ወቅት ምን ይሆናል (ከፍ ሲሉ) ⚙️✨
ምስልን ወደ AI upscaler ሲያስገባ፣ በተለምዶ እንደዚህ አይነት መስመር አለ፡
-
ቅድመ-ሂደት
-
የቀለም ቦታን ይቀይሩ (አንዳንድ ጊዜ)
-
የፒክስል እሴቶችን መደበኛ ያድርጉት
-
ምስሉ ትልቅ ከሆነ ወደ ቁርጥራጮች ይሰቅል (የVRAM እውነታ ፍተሻ 😭) ( የእውነተኛ-ESRGAN ማከማቻ (የንጣፍ አማራጮች) )
-
-
የባህሪ ማውጣት
-
የመጀመሪያዎቹ ንብርብሮች ጠርዞችን፣ ማዕዘኖችን እና ቅልመቶችን ይገነዘባሉ
-
ጥልቅ ንብርብሮች ቅጦችን ይለያሉ፡ ሸካራነቶች፣ ቅርጾች፣ የፊት ክፍሎች
-
-
መልሶ ግንባታ
-
ሞዴሉ ከፍተኛ ጥራት ያለው የባህሪ ካርታ ያመነጫል
-
ከዚያም ወደ ትክክለኛው የፒክሰል ውጤት ይቀይረዋል
-
-
ድህረ-ሂደት
-
አማራጭ ሹልነት
-
አማራጭ ዲኖይዝ
-
አማራጭ የቅርስ እገዳ (ደወል፣ ሃሎስ፣ እገዳ)
-
አንድ ስውር ዝርዝር፡- ብዙ መሳሪያዎች በጡቦች ውስጥ ከፍ ያሉ ሲሆኑ ከዚያም ስፌቶችን ያዋህዳሉ። ምርጥ መሳሪያዎች የንጣፍ ወሰኖችን ይደብቃሉ። ዓይኖቻቸውን ካጨለፉ ደካማ የፍርግርግ ምልክቶችን ይተዋሉ። አዎ፣ ዓይኖቻቸውን ያጨልማሉ፣ ምክንያቱም ሰዎች እንደ ትናንሽ ግሬምሊንስ በ300% ማጉላት ጥቃቅን ጉድለቶችን መመርመር ይወዳሉ 🧌
ለ AI ማራዘሚያ የሚያገለግሉት ዋና ዋና የሞዴል ቤተሰቦች (እና ለምን የተለየ ስሜት እንደሚሰማቸው) 🤖📚
1) በሲኤንኤን ላይ የተመሰረተው ሱፐር-ሪዞሉሽን (ክላሲክ የስራ ፈረስ)
ኮንቮሽናል የነርቭ ኔትወርኮች በአካባቢያዊ ቅጦች ላይ በጣም ጥሩ ናቸው፡ ጠርዞች፣ ሸካራነቶች፣ ትናንሽ መዋቅሮች ( ምስል ልዕለ-ጥራትን በመጠቀም ጥልቅ ኮንቮሽናል ኔትወርኮች (SRCNN) )።
-
ጥቅሞች፡ ፈጣን፣ የተረጋጋ፣ ያነሱ አስገራሚ ነገሮች
-
ጉዳቶች፡- ጠንክሮ ከተገፋ ትንሽ "የተሰራ" ሊመስል ይችላል
2) በGAN ላይ የተመሠረተ የማሳደጊያ (ESRGAN-style) 🎭
ጄኔሬቲቭ ተቃዋሚ ኔትወርኮች (GANs) አንድ ጀነሬተር አንድን አድልዎ ፈጣሪ ከእውነተኛዎቹ መለየት የማይችላቸውን ከፍተኛ ጥራት ያላቸውን ምስሎች ( ጄኔሬቲቭ ተቃዋሚ ኔትወርኮች ) እንዲያመነጭ ያሠለጥናሉ።
-
ጥቅሞች፡- ጥርት ያለ ዝርዝር፣ አስደናቂ ሸካራነት
-
ጉዳቶች፡- እዚያ ያልነበረ ዝርዝር ነገር መፍጠር ይችላል - አንዳንድ ጊዜ ስህተት፣ አንዳንድ ጊዜ ደግሞ እንግዳ ( SRGAN ፣ ESRGAN )
ጋን ያንን ትንፋሽ የሚጠይቅ ሹልነት ሊሰጥዎት ይችላል። እንዲሁም ለፎቶግራፍዎ ተጨማሪ ቅንድብ ሊሰጥ ይችላል። ስለዚህ… ውጊያዎችዎን ይምረጡ 😬
3) በስርጭት ላይ የተመሰረተ የማሳደግ (የፈጠራ ልዩ ምልክት) 🌫️➡️🖼️
የስርጭት ሞዴሎች ደረጃ በደረጃ ድምፁን የሚገልጹ ሲሆን ከፍተኛ ጥራት ያላቸውን ዝርዝሮች ( SR3 ) ለማምረት ሊመሩ ይችላሉ።
-
ጥቅሞች፡- በተለይም ለፈጠራ ስራ፣ በአሳማኝ ዝርዝሮች እጅግ በጣም ጥሩ ሊሆን ይችላል
-
ጉዳቶች፡- ቅንብሮች ጠበኛ ከሆኑ ከዋናው ማንነት/አወቃቀሩ ሊርቁ ይችላሉ ( SR3 )
“ከፍ ማድረግ” ወደ “እንደገና ማሰብ” መቀላቀል የሚጀምረው እዚህ ላይ ነው። አንዳንድ ጊዜ የሚፈልጉት ያ ነው። አንዳንድ ጊዜ እንደዚያ አይደለም።.
4) የቪዲዮ ማሻሻያ በጊዜያዊነት 🎞️
የቪዲዮ ማሻሻያ ብዙውን ጊዜ እንቅስቃሴን የሚያውቅ አመክንዮ ይጨምራል፡
-
ዝርዝሮችን ለማረጋጋት አጎራባች ክፈፎችን ይጠቀማል ( BasicVSR (CVPR 2021) )
-
የሚያብረቀርቁ እና የሚሳቡ ቅርሶችን ለማስወገድ ይሞክራል
-
ብዙውን ጊዜ ሱፐር-ጥራትን ከዲኖይዝ እና ዲኢንተርላሲንግ ጋር ያጣምራል ( ቶፓዝ ቪዲዮ )
የምስል ማሳደጊያ አንድን ሥዕል ወደነበረበት መመለስ ከሆነ፣ የቪዲዮ ማሳደጊያ የገጸ ባህሪውን አፍንጫ በእያንዳንዱ ገጽ ቅርፅ ሳይቀይር አንድን መጽሐፍ ወደነበረበት መመለስ ነው። ይህም… ከሚሰማው በላይ ከባድ ነው።.
የ AI ማሻሻያ አንዳንድ ጊዜ ለምን የውሸት ይመስላል (እና እንዴት መለየት እንደሚቻል) 👀🚩
የAI ማሻሻያ ዘዴዎች በሚታወቁ መንገዶች ይሳናሉ። አንዴ ቅጦችን ከተማሩ በኋላ፣ በየቦታው ያዩዋቸዋል፣ ለምሳሌ አዲስ መኪና መግዛት እና ያንን ሞዴል በየመንገዱ ላይ በድንገት ማየት 😵💫
የተለመዱት እንዲህ ይላሉ፡-
-
የሰም ቆዳ (በጣም ብዙ ዴኖይዝ + ለስላሳነት)
-
ከመጠን በላይ የተሳሉ ሃሎዎች (ክላሲክ “ከላይ የሚወጣ” ክልል) ( ቢኩቢክ ኢንተርፖሌሽን )
-
ተደጋጋሚ ሸካራነቶች (የጡብ ግድግዳዎች የቅጂ-መለጠፍ ቅጦች ይሆናሉ)
-
"አልጎሪዝም" የሚል ጥርት ያለ ማይክሮ-ንፅፅር
-
የጽሑፍ ማዛባት (በጣም መጥፎው ዓይነት)
-
SR3 ) ውስጥ በሚቀያየሩበት የዝርዝር መንሸራተት
አስቸጋሪው ክፍል፡- አንዳንድ ጊዜ እነዚህ ቅርሶች በጨረፍታ “የተሻሉ” ይመስላሉ። አእምሮዎ ስለታምነትን ይወዳል። ግን ከጥቂት ጊዜ በኋላ… ጠፍቶ ይሰማዋል።.
ጥሩ ዘዴው በመደበኛ የእይታ ርቀት ላይ ተፈጥሯዊ መስሎ መታየት አለመታየቱን ማጉላት ነው። በ400% ማጉላት ብቻ ጥሩ መስሎ ከታየ፣ ያ ድል አይደለም፣ የትርፍ ጊዜ ማሳለፊያ ነው 😅
የ AI Upscaling እንዴት እንደሚሰራ፡ የስልጠናው ጎን፣ ያለ የሂሳብ ራስ ምታት 📉🙂
እጅግ በጣም ጥራት ያላቸውን ሞዴሎች ማሰልጠን ብዙውን ጊዜ የሚከተሉትን ያካትታል፦
-
የተጣመሩ የውሂብ ስብስቦች (ዝቅተኛ-ጥራት ግብዓት፣ ከፍተኛ-ጥራት ኢላማ) ( ጥልቅ ኮንቮሽናል ኔትወርኮችን (SRCNN) በመጠቀም የምስል ልዕለ-ጥራት )
-
የተሳሳቱ የመልሶ ግንባታዎችን የሚቀጡ የኪሳራ ተግባራት SRGAN )
የተለመዱ የኪሳራ ዓይነቶች:
-
የፒክሰል መጥፋት (L1/L2)
ትክክለኛነትን ያበረታታል። ትንሽ ለስላሳ ውጤቶችን ሊያመጣ ይችላል። -
የአስተሳሰብ መጥፋት (ፐርሴፕሽናል ሎሰስ)
ከትክክለኛ ፒክሰሎች ይልቅ ጥልቅ ባህሪያትን (እንደ "ይህ ይመስላል ፐርሴፕሽናል ሎሰስ (ጆንሰን እና ሌሎች፣ 2016) )። -
የተቃዋሚ ኪሳራ (GAN)
እውነታዊነትን ያበረታታል፣ አንዳንድ ጊዜ ቃል በቃል ትክክለኛነት ( SRGAN ፣ Generative Adversarial Networks )።
የማያቋርጥ የጦርነት ጉትቻ አለ፡
-
ከመጀመሪያው ጋር
ታማኝ ያድርጉት vs. -
በእይታ ማራኪ ያድርጉት
የተለያዩ መሳሪያዎች በዚያ ስፔክትረም ላይ በተለያዩ ቦታዎች ላይ ይገኛሉ። የቤተሰብ ፎቶዎችን ወደነበሩበት እየመለሱ ወይም “ቆንጆ” መሆን ከፎረንሲክ ትክክለኛነት የበለጠ አስፈላጊ የሆነ ፖስተር እያዘጋጁ እንደሆነ ላይ በመመስረት አንዱን ሊመርጡ ይችላሉ።.
ተግባራዊ የስራ ፍሰቶች፡ ፎቶዎች፣ አሮጌ ቅኝቶች፣ አኒሜ እና ቪዲዮ 📸🧾🎥
ፎቶዎች (የቁም ሥዕሎች፣ የመሬት ገጽታዎች፣ የምርት ፎቶዎች)
በጣም ጥሩው ልምምድ ብዙውን ጊዜ የሚከተለው ነው-
-
መጀመሪያ መለስተኛ ድምጸ-ከል ማድረግ (አስፈላጊ ከሆነ)
-
ከወግ አጥባቂ ቅንብሮች ጋር የላቀ ደረጃ
-
ነገሮች በጣም ለስላሳ ከሆኑ እህሉን መልሰው ይጨምሩ (አዎ፣ በእውነት)
እህል እንደ ጨው ነው። ከመጠን በላይ እራትን ያበላሻል፣ ግን አንዳቸውም ትንሽ ጠፍጣፋ ጣዕም የላቸውም 🍟
አሮጌ ቅኝቶች እና በጣም የተጨመቁ ምስሎች
ሞዴሉ የመጭመቂያ ብሎኮችን እንደ "ሸካራነት" ሊቆጥራቸው ስለሚችል እነዚህ ከባድ ናቸው።
ይሞክሩ፦
-
የቅርስ ማስወገድ ወይም እገዳ ማስወገድ
-
ከዚያም ከፍተኛ ደረጃ
-
ከዚያም የብርሃን ሹልነት (ብዙ አይደለም… አውቃለሁ፣ ሁሉም ሰው እንዲህ ይላል፣ ግን አሁንም)
አኒሜ እና የመስመር ጥበብ
የመስመር ጥበብ ጥቅሞች ከሚከተሉት ውስጥ የሚከተሉት ናቸው፡
-
ንፁህ ጠርዞችን የሚጠብቁ ሞዴሎች
-
የተቀነሰ ሸካራነት ቅዠት
የአኒሜ ማሳደጊያ ብዙውን ጊዜ በጣም ጥሩ ይመስላል ምክንያቱም ቅርጾቹ ቀላል እና ወጥነት ያላቸው ናቸው። (እድለኛ።)
ቪዲዮ
ቪዲዮው ተጨማሪ እርምጃዎችን ያክላል፡
-
ዴኖይዝ
-
ዴይንተርሌስ (ለተወሰኑ ምንጮች)
-
አፕስኬል
-
ጊዜያዊ ማለስለስ ወይም ማረጋጊያ ( BasicVSR (CVPR 2021) )
-
ለኮሄሽን አማራጭ የእህል ዳግም ማምረት
የጊዜያዊ ወጥነትን ከዘለሉ፣ የሚያብረቀርቅ ዝርዝር ነገር ይደበዝዛል። አንዴ ካስተዋሉት፣ ማየት አይችሉም። ጸጥ ባለ ክፍል ውስጥ እንዳለ የሚጮህ ወንበር 😖
ያለምንም ጥርጥር ቅንብሮችን መምረጥ (ትንሽ የማጭበርበሪያ ወረቀት) 🎛️😵💫
ጥሩ የመነሻ አስተሳሰብ ይኸውና፡-
-
ፊቶች ፕላስቲክ የሚመስሉ ከሆኑ
ድምጾችን ይቀንሱ፣ ሹልነትን ይቀንሱ፣ የፊት መከላከያ ሞዴል ወይም ሁነታ ይሞክሩ። -
ሸካራነቶች በጣም ኃይለኛ የሚመስሉ ከሆነ
ዝቅተኛ "የዝርዝር ማሻሻያ" ወይም "የዝርዝር መልሶ ማግኛ" ተንሸራታቾች፣ ከዚያ በኋላ ስውር እህል ይጨምሩ። -
ጠርዞቹ የሚያበሩ ከሆነ
ሹልነትን ይቀንሱ፣ የሄሎ ማፈን አማራጮችን ያረጋግጡ። -
ምስሉ በጣም “AI” የሚመስል ከሆነ
የበለጠ ወግ አጥባቂ ይሁኑ። አንዳንድ ጊዜ ምርጡ እርምጃ በቀላሉ… ያነሰ ነው።
እንዲሁም፡- 8x ከፍ አታድርጉ ምክንያቱም ማድረግ ስለቻሉ ብቻ። ንፁህ 2x ወይም 4x ብዙ ጊዜ ጥሩ ነገር ነው። ከዚያ በኋላ፣ ሞዴሉን ስለ ፒክስልዎ የአድናቂ ልብወለድ እንዲጽፍ እየጠየቁት ነው 📖😂
ሥነ ምግባር፣ ትክክለኛነት እና አስቸጋሪው የ"እውነት" ጥያቄ 🧭😬
የAI ማበልጸጊያ መስመርን ያደበዝዛል፦
-
ተሐድሶ ማለት እዚያ የነበረውን ነገር መልሶ ማግኘት ማለት ነው
-
ማሻሻል ማለት ያልሆነውን መጨመር ማለት ነው
በግል ፎቶዎች፣ ብዙውን ጊዜ ጥሩ ነው (እና ደስ የሚል)። በጋዜጠኝነት፣ በሕግ ማስረጃ፣ በሕክምና ምስል ወይም ታማኝነት አስፈላጊ በሆነ በማንኛውም ነገር… ጥንቃቄ ማድረግ ያስፈልግዎታል ( OSAC/NIST፡ ለፎረንሲክ ዲጂታል ምስል አስተዳደር መደበኛ መመሪያ ፣ ለፎረንሲክ ምስል ትንተና የSWGDE መመሪያዎች )።
ቀላል ደንብ፡
-
ከፍተኛ ችግር ካለ፣ የ AI ማበልጸጊያን እንደ ምሳሌያዊ እንጂ እንደ ግልጽ እንዳልሆነ አድርገው ይቁጠሩት።
እንዲሁም ይፋ ማድረግ በሙያዊ ሁኔታዎች ውስጥ አስፈላጊ ነው። የአዕምሮ ህዋሳት ምርምር ክፉ ስለሆነ ሳይሆን ታዳሚዎች ዝርዝሮቹ እንደገና ተገንብተው ወይም ተይዘው እንደሆነ ማወቅ ስለሚገባቸው ነው። ያ ብቻ ነው… አክባሪ።.
የመዝጊያ ማስታወሻዎች እና አጭር ማጠቃለያ 🧡✅
ስለዚህ፣ የ AI Upscaling እንዴት እንደሚሰራ ይህ ነው፡ ሞዴሎች ከፍተኛ ጥራት ያለው ዝርዝር ከዝቅተኛ ጥራት ቅጦች ጋር እንዴት እንደሚዛመድ ይማራሉ፣ ከዚያም በማሳደግ ጊዜ ሊታመኑ የሚችሉ ተጨማሪ ፒክስሎችን ይተነብያሉ ( Deep Learning for Image Super-resolution: A Survey )። በሞዴል ቤተሰብ (CNN፣ GAN፣ ስርጭት፣ ቪዲዮ-ጊዜያዊ) ላይ በመመስረት፣ ያ ትንበያ ወግ አጥባቂ እና ታማኝ ሊሆን ይችላል… ወይም ደፋር እና አንዳንድ ጊዜ ያልተገደበ 😅
ፈጣን ማጠቃለያ
-
ባህላዊ የማራዘሚያ ፒክሰሎችን ( ቢኩቢክ ኢንተርፖሌሽን )
-
የ AI ማሻሻያ (Upscaling) የተማሩ ቅጦችን በመጠቀም የጎደለውን ዝርዝር ይተነብያል ( Deep Convolutional Networks (SRCNN) በመጠቀም የምስል ልዕለ-ጥራት )
-
ጥሩ ውጤቶች የሚመጡት ከትክክለኛው ሞዴል + ገደብ ነው
-
በቪዲዮው ላይ ሃሎዎችን፣ ሰም የሚመስሉ ፊቶችን፣ ተደጋጋሚ ሸካራነቶችን እና ብልጭ ድርግም የሚሉ ነገሮችን ይመልከቱ ( BasicVSR (CVPR 2021) )
-
አፕስኬሊንግ ብዙውን ጊዜ "ሊሆን የሚችል መልሶ ግንባታ" ነው፣ ፍጹም እውነት አይደለም ( SRGAN ፣ ESRGAN )
ከፈለጉ፣ ምን እያሳደጉ እንደሆነ ይንገሩኝ (ፊቶች፣ የድሮ ፎቶዎች፣ ቪዲዮ፣ አኒሜ፣ የጽሑፍ ቅኝቶች)፣ እና የተለመዱትን “የAI መልክ” ወጥመዶችን ለማስወገድ የሚሞክር የቅንብሮች ስትራቴጂ እጠቁማለሁ 🎯🙂
ተደጋጋሚ ጥያቄዎች
የ AI ማበልጸጊያ እና እንዴት እንደሚሰራ
የ AI ማበልጸጊያ (ብዙውን ጊዜ “እጅግ በጣም ጥሩ ጥራት” ይባላል) በስልጠና ወቅት ከተማሩት ቅጦች የከፍተኛ ጥራት ዝርዝሮችን በመተንበይ የምስል ጥራትን ይጨምራል። እንደ ቢኪዩቢክ ኢንተርፖሌሽን ያሉ ፒክስሎችን ከመዘርጋት ይልቅ፣ ሞዴል ጠርዞችን፣ ሸካራነቶችን፣ ፊቶችን እና የጽሑፍ መሰል ምቶችን ያጠናል፣ ከዚያም ከተማሩት ቅጦች ጋር የሚጣጣም አዲስ የፒክሰል ውሂብ ያመነጫል። “እውነታውን ወደነበረበት መመለስ” እና እንደ ተፈጥሯዊ የሚነበብ “ታምራዊ ግምት ማድረግ” ነው።.
የ AI ማሻሻያ ከቢኩቢክ ወይም ባህላዊ መጠን መቀየር ጋር ሲነጻጸር
ባህላዊ የማሳደግ ዘዴዎች (እንደ ቢኩቢክ ያሉ) በዋናነት በነባር ፒክሰሎች መካከል ይገናኛሉ፣ እውነተኛ አዲስ ዝርዝር ሳይፈጥሩ ሽግግሮችን ያቀላጥፋሉ። የAI ማራዘሚያ የእይታ ምልክቶችን በማወቅ እና የእነዚህ ምልክቶች ከፍተኛ ጥራት ያላቸው ስሪቶች ምን እንደሚመስሉ በመተንበይ አሳማኝ መዋቅርን እንደገና ለመገንባት ያለመ ነው። ለዚህም ነው የAI ውጤቶች በከፍተኛ ሁኔታ ስለታም ሊሰማቸው የሚችለው፣ እንዲሁም በምንጩ ውስጥ ያልነበሩ ቅርሶችን ማስተዋወቅ ወይም "መፈልሰፍ" የሚችሉት።.
ፊቶች ለምን ሰም ወይም ከመጠን በላይ ለስላሳ ሊመስሉ ይችላሉ
ዋክሲ ፊቶች ብዙውን ጊዜ የሚመጡት ከኃይለኛ ዴኖይዚንግ እና ማለስለስ ሲሆን ይህም የተፈጥሮ የቆዳ ሸካራነትን ከሚያስወግድ ሹልነት ጋር ተጣምሮ ነው። ብዙ መሳሪያዎች ድምጽን እና ጥሩ ሸካራነትን በተመሳሳይ መንገድ ያስተናግዳሉ፣ ስለዚህ ምስልን "ማጽዳት" ቀዳዳዎችን እና ስውር ዝርዝሮችን ሊያጠፋ ይችላል። የተለመደው አቀራረብ ዴኖይዚን እና ሹልነትን መቀነስ፣ ካለ የፊት መከላከያ ሁነታን መጠቀም፣ ከዚያም ውጤቱ ያነሰ ፕላስቲክ እና የበለጠ ፎቶግራፍ እንዲመስል እንደገና ማስገባት ነው።.
ሊጠበቁ የሚገባቸው የተለመዱ የ AI ማሻሻያ ቅርሶች
የተለመዱት መግለጫዎች በጠርዞች ዙሪያ ያሉ ሃሎዎች፣ ተደጋጋሚ የሸካራነት ቅጦች (እንደ ኮፒ-ለጥፍ ጡቦች)፣ ጥርት ያለ ማይክሮ-ንፅፅር እና ወደ "ፊደላት ማለት ይቻላል" የሚቀየር ጽሑፍ ያካትታሉ። በስርጭት ላይ በተመሰረቱ የስራ ፍሰቶች ውስጥ፣ ትናንሽ ባህሪያት በዝግታ የሚቀየሩበትን ዝርዝር መንሸራተትም ማየት ይችላሉ። ለቪዲዮ፣ በክፈፎች ላይ የሚንሸራተቱ እና የሚሳቡ ዝርዝሮች ትልቅ ቀይ ባንዲራዎች ናቸው። በከፍተኛ ማጉላት ጥሩ የሚመስል ከሆነ፣ ቅንብሮቹ ምናልባት በጣም ኃይለኛ ሊሆኑ ይችላሉ።.
የጂኤንኤን፣ የሲኤንኤን እና የስርጭት ማራገቢያዎች በውጤቶች እንዴት ይለያያሉ
በሲኤንኤን ላይ የተመሰረተው ሱፐር-ሪዞሉሽን የተረጋጋ እና የበለጠ ሊገመት የሚችል ቢሆንም፣ ጠንክሮ ከተገፋ “የተሰራ” ሊመስል ይችላል። በGAN ላይ የተመሰረቱ አማራጮች (ESRGAN-style) ብዙውን ጊዜ የበለጠ ጡጫ ሸካራነት እና የተሳለ ጥርት ያለ ስሜት ይፈጥራሉ፣ ነገር ግን በተለይ በፊቶች ላይ የተሳሳተ ዝርዝርን ሊያስታውሱ ይችላሉ። በስርጭት ላይ የተመሰረተ ማሻሻያ ውብ እና አሳማኝ ዝርዝር ሊፈጥር ይችላል፣ ነገር ግን መመሪያው ወይም የጥንካሬ ቅንብሮቹ በጣም ጠንካራ ከሆኑ ከመጀመሪያው መዋቅር ሊንሸራተት ይችላል።.
"በጣም AI" መልክን ለማስወገድ ተግባራዊ የቅንብሮች ስትራቴጂ
ወግ አጥባቂ ይጀምሩ፡ ከፍተኛ ደረጃ 2× ወይም 4×። ፊቶች ፕላስቲክ የሚመስሉ ከሆኑ፣ ወደ ኋላ የሚመለስ ድምጽ ማሰማት እና መሳላት እና ፊትን የሚያውቅ ሁነታን ይሞክሩ። ሸካራነቶች በጣም ኃይለኛ ከሆኑ፣ የዝርዝር ማሻሻያን ይቀንሱ እና ከዚያ በኋላ ስውር እህል ማከልን ያስቡበት። ጠርዞቹ የሚያበሩ ከሆነ፣ መሳለትን ይቀንሱ እና ሃሎ ወይም የቅርስ መጨፍለቅን ያረጋግጡ። በብዙ የቧንቧ መስመሮች ውስጥ፣ “ያነሰ” ያሸንፋል ምክንያቱም አሳማኝ እውነታን ይጠብቃል።.
ከማሻሻልዎ በፊት የድሮ ቅኝቶችን ወይም በጄፒጂ የተጨመቁ ምስሎችን ማስተናገድ
የተጨመቁ ምስሎች አስቸጋሪ ናቸው ምክንያቱም ሞዴሎች የብሎክ ቅርሶችን እንደ እውነተኛ ሸካራነት አድርገው ሊቆጥሯቸው እና ሊያጎሉ ስለሚችሉ። የተለመደው የስራ ፍሰት መጀመሪያ የቅርስ ማስወገድ ወይም ማገድ፣ ከዚያም ማጠንጠን፣ ከዚያም አስፈላጊ ከሆነ ብቻ የብርሃን ማጥራት ነው። ለቅኝቶች፣ ረጋ ያለ ጽዳት ሞዴሉ ከጉዳት ይልቅ በእውነተኛ መዋቅር ላይ እንዲያተኩር ሊረዳው ይችላል። ግቡ "የውሸት ሸካራነት ምልክቶችን" መቀነስ ነው፣ ስለዚህ የከፍተኛ ደረጃ ባለሙያው ከጫጫታ ግብዓቶች በራስ መተማመንን ለመገመት አይገደድም።.
የቪዲዮ ማሳደጊያ ከፎቶ ማሳደጊያ የበለጠ ከባድ የሆነው ለምንድነው?
የቪዲዮ ማሻሻያ በአንድ ምስል ላይ ብቻ ሳይሆን በክፈፎች መካከል ወጥነት ያለው መሆን አለበት። ዝርዝሮች ከክፈፍ ወደ ፍሬም የሚያብረቀርቁ ከሆነ ውጤቱ በፍጥነት ትኩረቱን የሚከፋፍል ይሆናል። በቪዲዮ ላይ ያተኮሩ አቀራረቦች መልሶ ግንባታን ለማረጋጋት እና የሚያብረቀርቁ ቅርሶችን ለማስወገድ ከጎረቤት ክፈፎች የተገኘውን የጊዜያዊ መረጃ ይጠቀማሉ። ብዙ የስራ ፍሰቶች ዲኖይዝ፣ ለተወሰኑ ምንጮች ዲኢንተርላሲንግ እና አማራጭ የእህል ዳግም ማስተዋወቅን ያካትታሉ፣ ይህም አጠቃላይ ቅደም ተከተል በሰው ሰራሽ ስለታም ሳይሆን እርስ በርስ የተሳሰረ ሆኖ እንዲሰማ ያደርጋል።.
የAI ማሻሻያ ተገቢ ካልሆነ ወይም በእሱ ላይ መተማመን አደገኛ በሚሆንበት ጊዜ
የAI ማሻሻያ (AI upscaling) እንደ ማሻሻያ እንጂ እንደ ማስረጃ ሳይሆን እንደ ማስረጃ ተደርጎ መታየት የተሻለ ነው። እንደ ጋዜጠኝነት፣ የህግ ማስረጃ፣ የህክምና ምስል ወይም የፎረንሲክ ስራ ባሉ ከፍተኛ ደረጃ ባላቸው አውዶች ውስጥ፣ “ተዓማኒ” ፒክሰሎችን ማመንጨት ያልተያዙ ዝርዝሮችን ሊጨምር ስለሚችል ሊያሳስት ይችላል። የበለጠ አስተማማኝ የሆነ ፍሬም በምሳሌያዊ መንገድ መጠቀም እና የAI ሂደት ዝርዝርን እንደገና መገንባት መሆኑን መግለጽ ነው። ታማኝነት ወሳኝ ከሆነ፣ የመጀመሪያዎቹን ያስቀምጡ እና እያንዳንዱን የማቀነባበሪያ ደረጃ እና አቀማመጥ ይመዝግቡ።.
ማጣቀሻዎች
-
arXiv - ለምስል ጥልቅ ትምህርት ልዕለ-ጥራት፡ የዳሰሳ ጥናት - arxiv.org
-
arXiv - ጥልቅ ኮንቮሽናል ኔትወርኮችን (SRCNN) በመጠቀም ምስል ልዕለ-ጥራት - arxiv.org
-
arXiv - Real-ESRGAN - arxiv.org
-
arXiv - ESRGAN - arxiv.org
-
arXiv - SR3 - arxiv.org
-
የNVIDIA ገንቢ - NVIDIA DLSS - developer.nvidia.com
-
AMD GPUOpen - FidelityFX Super Resolution 2 - gpuopen.com
-
የኮምፒውተር ቪዥን ፋውንዴሽን (ሲቪኤፍ) ክፍት መዳረሻ - ቤዚክ ቪኤስአር፡ በቪዲዮ ልዕለ-ጥራት ውስጥ አስፈላጊ ክፍሎችን መፈለግ (ሲቪፒአር 2021) - openaccess.thecvf.com
-
arXiv - ጀነሬቲቭ ተቃዋሚ ኔትወርኮች - arxiv.org
-
arXiv - SRGAN - arxiv.org
-
arXiv - የማስተዋል ኪሳራዎች (ጆንሰን እና ሌሎች፣ 2016) - arxiv.org
-
GitHub - Real-ESRGAN repo (የጣሪያ አማራጮች) - github.com
-
ዊኪፔዲያ - የቢኩቢክ ኢንተርፖሌሽን - wikipedia.org
-
ቶጳዝ ላብስ - ቶጳዝ ፎቶ - topazlabs.com
-
ቶጳዝ ላብስ - ቶጳዝ ቪዲዮ - topazlabs.com
-
የAdobe የእገዛ ማዕከል - Adobe Enhance > Super Resolution - helpx.adobe.com
-
NIST / OSAC - ለፎረንሲክ ዲጂታል ምስል አስተዳደር መደበኛ መመሪያ (ስሪት 1.0) - nist.gov
-
SWGDE - የፎረንሲክ ምስል ትንተና መመሪያዎች - swgde.org