Google Photos archyvo parsisiuntimas ir tvarkymas

:google: :exiftool: :fdupes: :nuotraukos:

Mano Google paskyra buvo beveik prisipildžiusi. Pradėjau gauti nuolat siunčiamus priminimus apie tai, bei pasiūlymus nusipirkti daugiau vietos. Ačiū, bet neplanuoju to daryti :-) Mano nuotraukos saugiai guli kitur, o Google jas tiesiog pasaugo, kad galėčiau patogiai parsisiųsti į kompiuterį. Dar kartais sugeneruoja kokį koliažą ir tiek.

Nusprendžiau, kad metas parsisiųsti ir susitvarkyti visą sukauptą mediją iš Google. Kompanija vartotojui duoda 15Gb naudotis nemokamai. Iš jų, nuotraukos ir video pas mane sudarė iki 9Gb. Kas nustebino, kad parsisiųsti archyvai užėmė net 59Gb!

Išpakavęs archyvus gavau daugybę paveiksliukų, video, bei JSON failų. JSON matyt yra naudojami, kad būtų patogiau skaityti metainformaciją kitais įrankiais. Be to, kaip vėliau sužinojau, ne visi failai turi EXIF informaciją, bet šie duomenys yra saugomi tuose JSON’uose. Paskui prisiminiau, kad Google leidžia laikyti “blogos kokybės” paveiksliukus nemokamai. Taip pat kiekvienas sukurto albumo katalogas saugo failo kopiją. Kuo daugiau albumų su tais pačiais failais

  • tuo daugiau nuotraukų ar filmų kopijų. Abejoju, kad taip pat duomenys yra saugomi ir Google serveriuose, bet jie būtent taip pateikiami archyvuose, kuriuos galime parsisiųsti. Štai todėl ir turim 59Gb vietoj 9.

Nuotraukų tvarkymas

Pasidariau išpakuoto archyvo darbinę kopiją (kad nereiktų siųstis ar pakuoti iš naujo, jei kažką netyčia ištrinsiu). Pirmiausiai nusprendžiau pašalinti nereikalingus JSON failus.

find -name "*.json" -exec rm {} +

Norėjau visas nuotraukas sukelti į katalogus pagal metus ir mėnesį, nes archive buvo gausybė katalogų pavadinimu “Untitled (xx)”, kur xx - kažkoks numeris. Jei media turi EXIF duomenis - tam labai praverčia exiftool įrankis. Šis skriptas yra tikrai galingas is vertas dėmesio - naudoju jį ne pirmą kartą, kai reikia tvarkyti nuotraukas. Pradžioj leidžiu su -testname, kad matyčiau ar failai bus perkelti ten - kur tikiuosi:

exiftool -r -d %Y/%m/%%f%%-c.%%e "-testname<CreateDate" .

Įsitikinęs, kad viskas taip, kaip noriu - perrašau “filename” EXIF reikšmę (kas ir perkelia failą ten, kur noriu):

exiftool -r -d %Y/%m/%%f%%-c.%%e "-filename<CreateDate" .

Pastebiu, kad dalis failų yra redaguoti - paryškintos spalvos ir pan. Jie turi *-edited priesagą ir dažniausiai yra geresnės kokybės. Nusperndžiau išsaugoti šiuos vietoj originalų. Tad originalus pašalinau perrašydamas “edited” failus vietoj jų. Tam pasirašiau bash skriptuką, kurio dabar jau nebeturiu.

Galiausiai, perkėlus nuotraukas iš skirtingų vietų, kataloguose atsirado dublikatų. Kadangi nuotraukų pavadinimai skirtingi, nepavyksta nustatyti vieno būdo, kuris tiktų pašalinti norimus dublikatus. Tam radau Fdupes programą, kuri randa rekursyviai visas vienodas nuotraukas ir filmus, sugrupuoja juos ir leidžia pasirinkti, kuriuos failus pašalinti. Programa leidžia parinkti failus pagal reguliarias išraiškas, pavadinimo dalį, invertuoti selekciją ir t.t. Deja, aš tai išmokau tik po to, kai rankomis jau buvau sužymėjęs apie 500 failų po vieną.

fdupes -r -d .

Po visų šių darbų dar liko šiek tiek failų, kurie niekur nebuvo perkelti ir neturėjo dublikatų. JSON’us jau buvau ištrynęs, o pačių failų nebuvo daug - tad tiesiog rankomis peržiūrėjau ką noriu pasilikti, o likusius - ištryniau. Sutvarkytą archyvą įkėliau kur reikia, pasidariau atsarginę kopiją ir atlaisvinau vietą Google paskyroje. Visas šis darbas užtruko kelias valandas, o rasti įrankiai ir bash žinios labai pagelbėjo.