Press "Enter" to skip to content

Hogyan készítsünk egy kerek mélyfűtést

Deepfake – A kép szintézis technológia mesterséges intelligencián alapul, és a képelemek cseréjére szolgál a kívánt képekhez. Ha nem hallott a dipfenről, olvassa el az alábbi videót. Ban, Jim Meskimen elolvassa a verset “csak egy szegény parody” húsz arca a hírességek.

Technológiai név – A “mélyképzés” kifejezések (Anglia). Mély tanulás) és “hamis” (eng. Hamisítvány). A legtöbb esetben a módszer egy generatív versenyző neurális hálózaton (GAN) alapul. Az algoritmus egy része az objektum fotóiban tanul, és létrehoz egy képet, szó szerint “versengő” az algoritmus második részével, miközben nem kezd el megzavarni egy példányt az eredeti.

A következő videó bemutatja a kecses képzési jelenetek mögött zajló folyamatok. Ahogy az SHAM00K projekt szerzője írja, az utolsó videó több órányi üzemóra, a felvételi anyagok és több ezer órák használatát használták. Kép. A generált adatok mennyisége körülbelül 1 TB.

A technológia alkalmazási területei

Már vannak minden YouTube- és reddit csatorna dipfab-görgőkkel. A DeepFake technológia számos célra használható.

Filmgyártás.A mai filmek gyártása rendkívül költséges költségfolyamat a bérleti kamerákkal, stúdiókkal és szereplők kifizetéseivel. A Deepfake technológiafejlesztés csökkenti a kiadási költségeket, a telepítést és a speciális hatásokat.

Lokalizációs hirdetés. Elég ahhoz, hogy egy hírességgel rendelkező reklámot írjon le, miután a rögzített személy át lehet adni a videóba a helyi szereplőkkel, beszélt a szlogenek natív nyelvükön. Ez az, hogy elérjük a hatást, mintha a híresség a termék országeloszlásának nyelvén beszélne.

Virtuális és fokozott valóság. A mimic transzfer technológiát lehet használni a digitális ikrek létrehozására játékokban, virtuális és kiegészítve valóságban. Az arca források is szolgálhatnak hírességeket vagy a játék résztvevőit. Ez növeli az érzelmi részvételt.

Nyilvánvaló, hogy a technológiát rendkívül óvatosan kell használni. A támadók büntetőeljárást okozhatnak a hamis hírek személyiségének vagy létrehozásának céljával. Október elején G. Az Egyesült Államok Senate Intude Bizottság tagjai felhívták a fő technológiai vállalatokat, hogy dolgozzanak ki egy tervet a dipafabák leküzdésére. Korábban, szeptemberében ebben az évben a Google létrehozott egy speciális adatkészlet-dipfeabs.

Ne feledje, hogy ezt a kiadvány kizárólag kutatási célokra készül.

jegyzet

Az év áprilisában frissítettük az útmutatót, hogy közelebb kerüljön a Deepfacelab könyvtár jelenlegi állapotához.

Hozzon létre saját mélyfájdat

A diszkfek szintéziséhez a népszerű Deepfacelab könyvtárat fogjuk használni. A könyvtár gyorsan fejlődik, több kiadvány áll rendelkezésre:

  1. Windows (Magnet Link) – Az utolsó kiadás, a letöltéshez szükséges Torrent kliens.
  2. Windows (Hab) – régi és új kiadványokat tartalmaz. A NVIDIA kártyák kb. 3 GB-os, valamint az OpenCL () verziója ().
  3. Google Colab (Github) – Távoli számítástechnikai teljesítményt használhat.
  4. Deepfacelab Linux (Github).
  5. CENTOS LINUX (GITHIB) – lemaradhat a kiadások fő ágából.

Az alábbiakban leírja a Dipfefe létrehozásának alapvető folyamatát a Windows példáján.

Fontos megérteni, hogy az eredmény minőségét a forrás videofájlok (felbontás és időtartam, az arc jellemzők, világítás és t. D.). A beállítások részleteihez és részleteihez az eredeti tárolóhoz átirányítva.

Rendszerkövetelmények a Deepfacelab számára

Minimális rendszerkövetelmények egy eszközzel való munkavégzéshez:

  • Windows 7 vagy újabb (64 bit).
  • SSE-utasítás támogatási processzor.
  • Legalább 2 GB + Paging fájl kapacitása.
  • OpenCL-kompatibilis videokártya (Nvidia, AMD, Intel HD Graphics).

Ajánlott rendszerkövetelmények:

  • AVX-oktatási segédpresszor.
  • A RAM kapacitása legalább 8 GB.
  • NVIDIA videokártya, legalább 6 GB-os videó memóriával.

A mélyfacelab munkájának algoritmusa

Terminológia előfeltétele:

  1. (Sokr. angolról. Forrás) – olyan személy, akit a helyettesítésére használnak,
  2. (Sokr. angolról. Rendeltetési hely) – az a személy, aki helyettesíti.

A szerelési archívumot a rendszerlemez gyökeréhez közel kell kicsomagolni. Miután kicsomagolása a Deepfacelab könyvtárban sok BAT fájlt talál.

A modell tárolási helye a belső könyvtár . Ez tartalmaz videót, fényképeket és programfájlokat. A mentési másolatok mentéséhez átmásolhatja a könyvtárat.

A mappát az algoritmus használja.

Közvetlenül a kicsomagolás után a videók példái már tartalmazhatnak. A leírt terminológiával összhangban helyettesítheti őket azonos nevű videofájlokkal és . Maximális támogatott felbontás – P. A fájlbővítmények példáit a dokumentáció tartalmazza: Mp4, Avi, MKV.

– Ez egy olyan mappa, amelyben a fájlból kivont keretek tárolódnak – a cél videó, amelyben megváltoztatjuk az arcot. A mappa két almappát is tartalmaz, amelyek a személyek “kitermelése” után hozhatók létre:

  • – Személyek képei (az arc-tereptárgyak beágyazott alanyaival)
  • – Forráskeretek arckifejezett iránymutatásokkal, amelyek a helyesen vagy helytelenül felismert arcok azonosítására szolgálnak.

– Ez egy mappát, melyben a keretek kinyert fájl tárolásra kerül, vagy más keretek a JPG formában a tulajdonos az új személy ábrázol. Mint a személyek kivonása után, két almappát hoznak létre:

  • – Személyek kivonása
  • Ugyanazt a funkciót végzi, mint az SRC adatkészlet eltávolításához, a mappa nem alapértelmezés szerint történik. Ha szeretné, akkor ki kell választania, ha elkezdi az extrakciót, hogy létrehozza azt.

Mivel észreveszed, a batfájlok a kicsomagolt katalógus gyökerében a név elején vannak. Minden szám megfelel az algoritmus bizonyos lépésének. Néhány elem opcionális. Séta ezen a sorozaton.

1. A munkakatalógus tisztítása

Az első lépésben a hely elindítása és megnyomása megtisztíthatja a mappa felesleges tartalmát . Egyidejűleg hozza létre a szükséges könyvtárat.

2. Keretek eltávolítása a forrás videofájlból (DATA_HAB4)

A második lépésben távolítsa el a képeket () képeket (). Ehhez indítsa el a BAT fájlt, kérjük egy meghívást, hogy jelezze a keretfrekvenciát:

Ugrás az elemre az Enter gombra kattintva az összes keret kivonásához.

PNG formátumban, fájlok eltávolítása minőségromlás nélkül, de a nagyságrenddel lassabban és nagy térfogatú, mint a JPG. A beállítások beállítása után a keretek a katalógusba kerülnek .

3. Keret jelenetek eltávolítása az arcátvitelhez (opcionális)

Szükség esetén vágja le a videót . Ez az elem kényelmes, ha soha nem élvezi a videó szerkesztési szoftvert. Húzza a fájlt a BAT-fájl tetején. Adja meg az ideiglenes címkéket, a hangsávszámot (ha vannak több közülük), és ha szükséges, a kimeneti fájlbit aránya. Megjelenik egy további fájl az utótaggal .

Fuss a DST Scene Frames kivonásához. A fájlok automatikusan átkerülnek a katalógusba . Ami esetében lehetőség van a JPG / PNG kiválasztására.

4. A forrás személyek mintavételezése

Ebben a szakaszban kezdődik a mély képzés. Az arcokat az SRC-kereteken kell érzékelni. A kapott mintát az alábbiakban tárolják . Ez az elem megfelel a BAT-fájlok sorának . Szabványos megközelítéssel az arcfelismerés SF3D-algoritmusa van. A következő lehetőségek vannak:

  1. Válogatás a zóna szeretnénk kivonat: terület növekszik Full Face (), hogy egész arc () és a fej ().
  2. Használja az opciót (használja az összes videokártyát), (használja a legjobbat). Válasszon egy második opciót, ha külső és beépített videokártya van, és az irodai alkalmazásokban párhuzamosan kell dolgoznia.
  3. Írjon vagy nem az érzékelők eredményét. Minden egyes, az egyének dedikált kontúrjait rögzítik .

Példa a program kimenetére, amikor az NVIDIA GeForce MX videokártyán kezdődik:

Hasonló denevérfájlt használ egy szóval, hogy manuálisan megtérüljön a már kivont személyek hibái esetén a színpadon .

Távolítunk el nagy csoportokat a hibás keretekről

Dob . Elindítja a böngészőt, amelyben megtekintheti a mappa tartalmát a hamis pozitív és helytelenül meghatározott személyekhez képest, hogy eltávolítható legyenek.

Ebben a szakaszban el kell távolítania Nagy csoportok Helytelen keretek, amelyek nem fordítják a számítástechnikai erőforrást. A helytelen személyzet magában foglalja mindazt, ami nem tartalmaz egyértelműen megkülönböztetett személyt. Az arcot nem szabad zárni a témával, a szőrrel stb. Ne pazarolja az időt kis csoportokra. Töröljük őket a következő lépésben.

Egyéb hibás keretek rendezése és eltávolítása

A fájl a hibás keretek csoportjainak rendezésére és azonosítására szolgál. A böngésző bezárása nélkül, egymás után indítsa el a BAT fájlt a kívánt opcióval, és távolítsa el a hibás keretek csoportjait (általában a végén található). Elérhető opciók:

  • A képkereteket élességgel rendezi, távolítsa el a keretet fuzzy arcokkal.
  • a nézetre nézve balról jobbra válik.
  • rendezi az arcokat, hogy a lista elején az arc lencse lenézett, és a végén.
  • Csoportok tartályok, lehetővé teszi a felesleges arcok eltávolítását csoportok szerint.
  • A felsorolás végéhez közelebb kerül a legtöbb hasonló (általában arcok arcok). Belátása szerint törölheti része a lista végén, hogy ne magatartási képzés azonos személyek.
  • Megfelel a fekete képpontok fényességének, telítettségének és számának. Segít az átmeneti felvételek eltávolításában, ahol az arc nehéz megkülönböztetni.
  • – segít kiemelni a legjelentősebb személyeket.

egy mappát generál a személyek kivonása után .

egy speciális gépi tanulási algoritmust használ az adatkészlet minőségének minőségének méretezéséhez / “javításához”. Hasznos, ha a keretek egy kicsit elmosódnak, és jobban meg akarod tenni őket.

A fájlok és lehetővé teszi, hogy mentési és visszaállítási adatok kivont paraméterei fő / adatokat, hogy lehet szerkeszteni a képeket az emberek, miután eltávolította veszteség nélkül azonosítási adatait. Például növelheti az élességet, a szemüveget, a bőrön lévő foltokat, színkorrekciót készíthet.

és szolgálja a személyek csomagolását (kicsomagolása) a mappából egy fájlba. Az elő-tanuláshoz szükséges egyedi adatkészlet előkészítéséhez, egyszerűsítése egyszerűsíti az egyetlen fájl formájában történő megosztását, és jelentősen csökkenti az adat tárcsázási időt (másodpercek helyett percek helyett).

A képneveket a forrás / fájlnevekhez adja vissza. Nem feltétlenül – a képzés és az egyesülés végrehajtásra kerül a forrásfájlnevek függetlenül.

5. A minta jelenet minta (DST) készítése

A következő műveletek egyes különbségekkel megegyeznek a forrás személyének mintájával. A fő különbség az, hogy a fogadó jelenetre fontos meghatározni, hogy Összes Az embert is sárosokat tartalmazó személyek. Ellenkező esetben ezeken a képkockák nem kerülnek helyettesítve a forrás.

Automatikus extrakciót hajt végre az S3FD algoritmus segítségével.

Lehetővé teszi, hogy manuálisan jelezze az arc kontúrjait a kereteken, ahol az arcot nem határozták meg. Ugyanakkor, a fájlkivonás végén a kézi korrekciós ablak nyitva van. A vezérlőelemeket az ablak tetején ismertetjük (a kulcs).

A mappából törölt keretek kézi helyreállítása . További információ erről tovább.

Minden kivonó lehetővé teszi, hogy a GPU és a CPU között válasszon, valamint meghatározza a kivonáshoz rendelt területet. Hasonlóképpen, vagy .

Kézi kivonat (kézi kivonó)

Az indítás után megnyílik egy ablak, amelyben manuálisan megtalálhatja azokat az arcokat, amelyeket kivonni szeretne, vagy megtérítheti:

  • Jelölje ki az arcot az egérrel.
  • Az egérkerék használatával megváltoztathatja a keresési terület méretét.
  • Győződjön meg róla, hogy az összes vagy legalábbis a legtöbb tereptárgy fontos pontokon (szem, száj, orr, szemöldök) és helyesen követi az arc kontúrjait. Bizonyos esetekben szögétől függően a világítás vagy a meglévő akadályok, lehet, hogy lehetetlen pontosan összehangolják az iránymutatások, így csak próbálja meg, hogy a látható részek borítják.
  • A pontosság mód megváltoztatásához használja a gombot . Most az iránymutatások nem „bot”, hogy észlelt azoknak észlelt, de sokkal pontosabban pozícionálja a tereptárgyak.
  • Előre és hátra mozoghat, használja a kulcsokat és . A szerkesztéshez nyomja meg a vagy a bal egérgombot.
  • A fennmaradó élek kihagyásához és az elszívóból való kilépéshez használja a gombot .

A mappa eredményeinek megtekintéséhez futtathat .

A mappa tartalmának futtatásához keresse meg és távolítsa el azokat a kereteket, amelyeken a célszemélyzete helytelenül illesztett iránymutatásokat vagy tereptárgyakat nem írta ki, .

Adat jelenet törlése

Miután azonosítottuk a határokat, ugyanúgy kell törölni őket ugyanúgy, mint amilyenek a forráshalmazával. Azonban a céladatkészlet tisztítása azonban eltér a forrástól, mivel azt szeretnénk, hogy az összes él, amelyet minden olyan kerethez kell igazítani, amelyben jelen vannak, beleértve a problémát is.

Indítsa el a Segítséggel való válogatással és a válogatás használatával . Személy szerint kerül rendezésre hasonlóság, szín, szerkezet – könnyebb lesz a csoport hasonló és eltávolítás képeket tartalmazó hamis válaszok, az arcok mások, és helytelenül meghatározott határok. A hibás határok eltávolításának nagykövete visszaállítja a felhasználók használatát és sorrendjét .

Nyissuk meg a mappát, és a következő, nyílt PowerShell és a következő parancs segítségével távolítsa el a képzők származó fájlneveket megjelölt felületeken:

Várjon, amíg a folyamat befejeződik – befejezése után a mappa címe ismét megjelenik.

Ha a jelenetnek keresztfódus átmenetei vannak, vagy a tükrökben tükröződő arc, talál egy utótaggal rendelkező fájlokat, mozgassa őket egy külön mappába, és indítsa újra a forgatókönyvet, de cserélje ki a csapatot . Másolja vissza az eredményt a fő mappába, és győződjön meg róla, hogy mentse az összes fájlt.

Hozzon létre egy mappát . Ezután jelölje ki az összes fájlt a mappában, másolja őket, hogy a frissen létrehozott példányt a mappát, várjon a befejezése, és miközben az összes újonnan helyébe fájlokat továbbra is kiemelt, törölje őket. Tekintse meg a többi keretek és mindent törölni, hogy nincsenek emberek az eltávolítani kívánt kézzel. Másolása a fennmaradó keret vissza az eredeti mappába, kicserélni, várakozás a befejezése, és amíg az összes helyébe fájlokat továbbra is kiemelt, törölje őket.

Az ilyen manipulációk után a mappa csak olyan kereteket tartalmaz, amelyekből a személyeket helyesen letöltötték, valamint olyan kereteket, amelyekből az elszívó nem tudta megfelelően eltávolítani a személyt, vagy nem távolítható el. Most már kézzel is kivonhatja őket, mielőtt megtenné, hogy gyorsan megtudhatja a fennmaradó javítót, és megnézheti, hogy az irányelvek helyesen néznek-e.

Ha még jobban szeretné javítani a minőségi jelölést, használjon egy alternatív XSEG Markup modellt, amelyet részletesen ismertetünk. Hivatalos kézikönyv.

6. Oktatás

Training Neuraletas – a legtöbb időtartamú rész, amely az utolsó órákon és a napon lehet. A képzéshez az egyik modell közül választhat. Az eredmény kiválasztását és minőségét a videokártya memóriája határozza meg. Két modell elérhető a program jelenlegi verziójában:

  • . Testreszabható modell a nagy teljesítményű grafikus processzorokhoz.
  • . Egyszerű mód A grafikus processzorokhoz tervezett GB video memóriával.

Amikor először indul, a program megkéri, hogy adja meg a későbbi elindításban használt paramétereket (amikor megnyomja az Enter billentyűt, az alapértelmezett értékeket használjuk). A legtöbb paraméter érthető intuitív, másokat a kézikönyvben ismertetünk.

Kérjük, vegye figyelembe, hogy egyes paraméterek nem módosíthatók a tanulás megkezdése után, például:

  • Modellfelbontás (modellfelbontás)
  • Modell építészet (modell architektúra)
  • Modellek Méretek
  • Arc típus (arc típus)

Tekintsük más modellparamétereket is.

: A modell automatikus biztonsági mentése minden órával. Alapértelmezett letiltva.

: A modell leállítja a tanulást, miután eléri a megadott számú iteráció elérését, például, ha csak ezer modellt szeretne edzeni. iterations, be kell adnia egy értéket, ha 0-tól egyenlő értéket hagy, a modell akkor fog működni, amíg meg nem állíthatja manuálisan.

: Hasznos opció olyan esetekben, amikor nincsenek minden szükséges sark az arcban a forráskészletben.

: A paraméter befolyásolja a személyek számát, összehasonlítva egymással az egyes iteráción. A legkisebb érték 2, de növelheti az értéket, ha a grafikus processzor képes megbirkózni vele. Minél magasabb a modellek felbontása, dimenziói és több jellemzői, annál több VRAM szükséges, ezért szükség lehet kisebb csomagméretre. Javasoljuk, hogy ne használja a 4 alatti értéket. A kezdeti szakaszban alacsonyabb értéket állíthat be a kezdeti tanulás felgyorsításához, majd növelheti azt. Optimális értékek – 6-tól

: Kiválaszthatja a modell architektúrájának típusát. Két fő típus: és . Mindkét modell kiváló minőségű, de jobban működik az arcok számára, és sokkal kvalitatívabbá válik az átalakításokkal. A címben szereplő további betűk megfelelnek a hasonlóság () növekedésének és a modell felbontásának növekedésének ().

Az egyéb beállításokat részletesen ismertetjük az eredeti kézikönyvben.

Mit kell fordítania

Letiltja a video memóriát használó programokat. Ha a konzolon való képzés során sok szöveget tartalmaz, vagy a GPU-n, a modell nem indult el, és meg kell vágni. Be kell állítania a modellek opcióit.

A megfelelő körülmények között a konzollal párhuzamosan megjelenik a képzési előnézeti ablak, amelyben megjelenik a tanulási folyamat és a hiba görbe. A görbe csökkentése tükrözi az edzést. A (angol elrendezés) gomb frissíti az előnézetet.

A tanulási folyamat megszakítható kattintva a képzés előnézeti ablak, és bármikor futtatható, a modell továbbra is tanulni azonos időpontban. Minél hosszabb ideig tart, annál jobb az eredmény.

7. Átfedési személyek

Most van egy tanulási eredményünk. Kombinálni kell – Licenc és Footage –sen. A BAT fájlok listájából válassza ki azt a modellt, amelyen a képzés történt.

A Deepfacelab új verziójában számos különböző maszkkal ellátott átfedési módok és további beállítások állnak rendelkezésre. Az első minta paramétereként az alapértelmezett paraméterek (az Enter megnyomásával) segítségével (az Enter megnyomásával), és megváltoztathatja őket, ha nem rendezi a jelenet és az új arc eredményét.

nyolc. Videóba lapot

Miután az összes arcot egyesíti / konvertálja az összes arcot, egy mappát tartalmazó név, amely tartalmazza az összes keretet, valamint olyan könyvtárat, amely a maszkkereteket tartalmazza a mappában. Az utolsó lépés az, hogy visszaállítsák őket a videóba, és kombináljam a Forrás hangjelzést a fájlból .

A végleges fájl a név alatt kerül mentésre . Mp4 és AVI formátumok állnak rendelkezésre. Kész! Az alábbi példa a teszt videóhoz kapott példa.

Ha az eredmény nem felel meg, próbáljon meg különböző átfedési lehetőségeket, vagy folytassa az edzést, hogy fokozza a tisztaságot, használjon másik modellt vagy más videót a forrással. A könyvtár, más tanácsok és trükkök megkülönböztethető jellemzői, az eredeti kézikönyvben és megjegyzésekben olvashatók.

A Deepfake tesztelése? Ossza meg az eredményeket;)

Comments are closed, but trackbacks and pingbacks are open.