[๐ ] Memindahkan Backup PDF Naver Blog ke GitHub Pages
โจ Ringkasan GPT-5.5 ใ
Catatan tentang mengekstrak 173 tulisan dan 1.521 gambar dari 18 backup PDF Naver Blog, lalu menanamkannya kembali ke dalam struktur blog GitHub Pages yang sudah ada.
Aku jadi ingin membawa kembali tulisan-tulisan yang sudah menumpuk di Naver Blog ke blog GitHub Pages ini.
Lebih tepatnya, ini bukan sekadar soal menyimpan file backup di suatu tempat. Tulisan-tulisan itu sudah ada. Ada tanggalnya, ada gambarnya, ada kategorinya, dan ada pikiran dari masa itu. Namun semua catatan itu berada terpisah di rumah lain bernama Naver Blog.
Pada akhirnya, aku ingin menjadikan blog ini kembali sebagai pusat catatanku. Blog GitHub Pages memang sederhana, tetapi aku bisa menumpuk catatan dengan struktur yang kuinginkan.
Namun kali ini masalahnya bukan menulis satu tulisan baru.
Aku harus mengambil 18 backup PDF Naver Blog, lalu memindahkan tulisan dan gambar di dalamnya kembali ke struktur blog Jekyll yang sudah ada.
Aku mulai dari menetapkan syarat
Sejak awal, tujuannya sederhana.
Aku ingin membawa masuk backup Naver Blog, tetapi membuatnya terbaca seolah-olah sejak awal memang berada di dalam blog ini.
Aku menetapkan beberapa syarat.
- Ekstrak semua tulisan di dalam 18 PDF tanpa ada yang terlewat.
- Sisakan tanggal tulisan dan tautan asli.
- Letakkan gambar di bawah
assets/images/YYYY-MM/YYYY-MM-DD/sesuai kebiasaan blog yang sudah ada. - Lanjutkan nomor seri
Hari Inidari tulisan yang sudah ada. - Jangan mencampur tulisan seperti restoran, perjalanan, AI, dan pengembangan ke dalam nomor
Hari Ini. - Jangan memaksa tulisan masuk ke kategori yang sudah ada; buat kategori baru jika diperlukan.
- Jangan membawa kalimat yang rusak dari PDF begitu saja.
- Hasil akhirnya harus berupa tulisan Jekyll yang bisa dibangun.
Kalau ditulis dengan kata-kata, ini terdengar biasa. Namun saat benar-benar dilakukan, ini bukan sekadar menyalin file.
Ini adalah pekerjaan memindahkan catatan dari satu sistem ke sistem lain.
Teks PDF saja tidak bisa dipercaya
Awalnya, aku mengira cukup mengekstrak teks dan gambar dari PDF.
Memang, tulisannya terekstrak. Gambarnya juga terekstrak. Namun masalahnya ada di isi tulisan. Kalimat yang diambil dari PDF terputus aneh di sana-sini.
Misalnya seperti ini.
Bersikeras ingin mengendalikan badai besar itu sendirian secepat mungkin, dorongan berlebihan semacam itu sendiri menjadi penyebab terbesar yang membuatku tidak berdaya
karena itu.
Satu kalimat terbelah seperti paragraf, kata-kata pecah, dan ritme bacanya rusak.
Kalau dipindahkan dalam keadaan seperti itu, mungkin bisa disebut backup, tetapi tulisannya rusak. Itu bukan lagi tulisan yang dibaca manusia, melainkan lebih dekat ke bekas teks yang dicabut paksa dari PDF.
Jadi aku mengubah arah.
PDF kupakai sebagai titik awal untuk daftar tulisan dan ekstraksi gambar, lalu isi tulisan kupulihkan dengan membaca ulang HTML asli Naver. Aku mengikuti alur paragraf, daftar, dan kutipan dari editor Naver, lalu membangun ulang isi tulisan menjadi Markdown.
Baru setelah itu tulisan-tulisan itu kembali terasa seperti tulisan.
Gambar kusesuaikan dengan cara blog ini
Gambar juga penting.
Tulisan di Naver punya banyak gambar. Terutama untuk tulisan perjalanan atau restoran, gambar hampir menjadi bagian utama dari isi tulisan. Kalau hanya teks yang dipindahkan, catatannya menjadi setengah kosong.
Pada akhirnya, gambar yang berhasil dibawa masuk berjumlah 1.521.
Jalur gambar disesuaikan dengan kebiasaan blog yang sudah ada.
assets/images/2025-09/2025-09-09/naver-004-001.jpg
Aku merapikannya dengan nama file yang memuat tahun-bulan, tanggal, dan nomor import Naver. Dengan begitu, bahkan nanti saat melihat file saja, aku masih bisa melacak gambar itu berasal dari tanggal dan import yang mana.
Di dalam isi tulisan, aku tetap memakai sintaks gambar Markdown biasa.

Untuk blog statis, kesederhanaan seperti ini penting. Setelah build selesai, semuanya hanyalah file. Tidak perlu bergantung pada server gambar terpisah atau tautan luar.
Kategori kubagi ulang
Bagian yang paling perlu hati-hati adalah kategori.
Awalnya, aku sempat berpikir apakah tulisan-tulisan Naver itu bisa dimasukkan saja secara kasar ke bawah diary. Namun kalau begitu, nanti tulisan akan sulit dicari, dan struktur blog juga menjadi kabur.
Jadi aku membuat kategori baru.
diary life
diary thought
diary relationship
diary restaurant
diary travel
Kategori lama seperti diary ai, diary dev, dan diary religion juga tetap dipakai. Tulisan bacaan/mindset masuk ke reading mindset, tulisan pengenalan aplikasi ke tip app, dan catatan pembangunan blog ke subkategori devlog github-pages-blog.
Membuat kategori baru tidak selesai hanya dengan memindahkan satu file.
Perlu halaman kategori. Perlu navigasi sidebar. Label kategori dan tautan yang terlihat di archive juga harus cocok. Ikon di depan judul pun harus mengikuti kebiasaan blog yang sudah ada.
Tulisan restoran kurapikan dengan [๐ฝ๏ธ], tulisan AI dengan [๐ค], tulisan pengembangan dengan [๐งโ๐ป], tulisan perjalanan dengan [๐งณ], dan seterusnya.
Kelihatannya kecil, tetapi kalau bagian-bagian seperti ini berantakan, tulisan yang dibawa masuk akan terus terasa seperti benda asing dari luar.
Nomor Hari Ini kujaga terpisah
Bagian yang paling mudah membingungkan adalah nomor Hari Ini.
Tulisan Today's Verification yang ada di Naver pada dasarnya adalah Daily Review. Jadi tulisan-tulisan itu harus tersambung dengan seri Hari Ini di blog yang sudah ada.
Sebaliknya, tulisan restoran, perjalanan, AI, dan bacaan bukan bagian dari Hari Ini, meskipun tanggalnya berdekatan. Kalau tulisan-tulisan itu ikut masuk ke nomor seri, seri itu sendiri akan rusak.
Hasil akhirnya kusesuaikan seperti ini.
Hari Ini #1 ~ #200
Nomornya tersambung dari 1 sampai 200, tanpa ada yang hilang atau dobel. Aku juga memastikan tulisan non-Daily Review tidak berisi nomor Hari Ini #.
Ini bukan sekadar merapikan angka.
Ini pekerjaan menjaga identitas sebuah seri.
Verifikasi adalah separuh pekerjaan
Hal yang menakutkan dari pekerjaan migrasi seperti ini adalah tampilannya bisa terlihat meyakinkan dari luar, padahal satu per satu ada yang melenceng di dalam.
Bisa saja file gambar tidak ada, tetapi referensi Markdown-nya tersisa. Front matter kategori bisa tidak cocok dengan folder sebenarnya. Ikon judul bisa berbeda dari kebiasaan yang sudah ada. Ikon ? yang rusak dari PDF bisa tertinggal begitu saja di isi tulisan.
Jadi aku menjalankan verifikasi terpisah.
Yang kuperiksa kira-kira seperti ini.
Tulisan import: 173
Referensi gambar: 1.521
Gambar hilang: 0
Sisa ? tunggal yang terlihat: 0
Nomor Hari Ini: #1 ~ #200
Nomor non-Daily Review tercampur: 0
Ketidakcocokan folder kategori: 0
Pada akhirnya, aku juga menjalankan build Jekyll.
bundle exec jekyll build
Untuk blog statis, build yang lolos baru membuatku bisa merasa tenang. Satu saja sintaks Liquid di Markdown rusak, seluruh situs bisa berhenti.
Hasil
Pada akhirnya, aku memindahkan 173 tulisan dan 1.521 gambar dari 18 backup PDF Naver Blog ke blog ini.
Namun yang lebih penting bukan angkanya.
Pekerjaan ini bukan backup sederhana. Ini pekerjaan memulihkan catatan yang tercecer ke dalam satu sistem.
PDF, HTML Naver, front matter Jekyll, halaman kategori, navigasi sidebar, jalur gambar, dan nomor seri semuanya harus cocok. Satu saja meleset, konteks catatannya ikut pecah.
Bagi orang lain, ini mungkin terlihat seperti sekadar memindahkan tulisan. Namun bagiku, ini adalah pekerjaan merapikan kembali sistem catatan.
Aku tidak sekadar membawa masuk banyak tulisan. Aku kembali menentukan bagaimana catatan yang sudah kubangun perlu distrukturkan, bagaimana data yang rusak perlu dipulihkan, dan bagaimana semuanya bisa menetap di dalam kebiasaan sistem yang sudah ada.
Menulis catatan itu penting, tetapi memegangnya kembali supaya tidak hilang juga penting.
Pekerjaan kali ini lebih dekat ke sisi itu.
Tinggalkan komentar