2026.06.05 (金)
2026.06.06 (土) 曎新

✹ GPT-5.5の芁玄  

NaverブログのPDFバックアップ18個から蚘事173本ず画像1521枚を抜出し、既存のGitHub Pagesブログ構造の䞭ぞ移怍し盎した蚘録。

Naverブログにためおいた蚘事を、もう䞀床GitHub Pagesブログぞ持っおきたくなった。

正確に蚀うず、単にバックアップファむルをどこかに保管したかったわけではなかった。すでに曞いた蚘事があった。日付もあり、画像もあり、カテゎリもあり、その時期に考えおいたこずもあった。けれどその蚘録は、Naverブログずいう別の家に眮かれたたただった。

結局、僕はこのブログを自分の蚘録の䞭心ずしお立お盎したかった。GitHub Pagesブログはシンプルだけれど、自分が望む構造で蚘録を積み䞊げられる。

ただ、今回は新しい蚘事をひず぀曞く話ではなかった。

NaverブログのPDFバックアップ18個を受け取り、その䞭に入っおいる蚘事ず画像を、既存のJekyllブログ構造の䞭ぞ移し盎す必芁があった。

たず条件を決めた

最初から目暙は単玔だった。

Naverブログのバックアップを取り蟌む。ただし、このブログの䞭で最初から存圚しおいた蚘事のように読める状態にしたかった。

条件をいく぀か決めた。

  • PDF 18個の䞭の蚘事を挏れなく抜出する。
  • 蚘事の日付ず元リンクを残す。
  • 画像は既存ブログの慣䟋に合わせお assets/images/YYYY-MM/YYYY-MM-DD/ の䞋に眮く。
  • 今日の䞀日 シリヌズ番号は既存蚘事ず぀ながるようにする。
  • グルメ、旅行、AI、開発のような蚘事は 今日の䞀日 番号に混ぜない。
  • 既存カテゎリぞ無理に抌し蟌たず、必芁なら新しいカテゎリを䜜る。
  • PDFで壊れた文をそのたた持ち蟌たない。
  • 成果物はビルド可胜なJekyll蚘事であるこず。

蚀葉にするず普通だ。ずころが実際にやっおみるず、これはただのファむルコピヌではなかった。

蚘録を別のシステムぞ匕っ越しさせる䜜業だった。

PDFのテキストだけを信じおはいけなかった

最初は、PDFからテキストず画像を抜き出せば終わるず思っおいた。

実際に蚘事は抜出できた。画像も抜出できた。けれど問題は本文だった。PDFから持っおきた文が、ずころどころ倉な䜍眮で切れおいた。

たずえばこんな感じだった。

その巚倧な嵐を僕ひずりで䞀日も早く制埡しようずする、そんな過剰な意欲そのものが僕を無力にさせる䞀番倧きな原因で

あるからだ。

ひず぀の文が段萜のように割れ、単語が分断され、読むリズムが厩れおいた。

この状態で移せばバックアップにはなるかもしれない。でも蚘事は壊れる。人が読む文章ずいうより、PDFから剥がれ萜ちた痕跡に近かった。

だから方針を倉えた。

PDFは蚘事䞀芧ず画像抜出の出発点ずしお䜿い、本文はNaverの元HTMLをもう䞀床読んで埩元した。Naver゚ディタの段萜、リスト、匕甚の流れを远いながら、Markdown本文ずしお䜜り盎した。

そこでようやく、蚘事が蚘事らしく戻っおきた。

画像は既存ブログの方匏に合わせた

画像も重芁だった。

Naverの蚘事には画像が倚かった。特に旅行蚘事やグルメ蚘事では、画像が本文そのものに近かった。テキストだけを移すず、半分だけの蚘録になっおしたう。

最終的に取り蟌んだ画像は1521枚だった。

画像パスは既存ブログの慣䟋に合わせた。

assets/images/2025-09/2025-09-09/naver-004-001.jpg

幎-月、日付、そしおNaver import番号が入ったファむル名で敎理した。こうしおおくず、埌からファむルを芋おも、どの日付のどのimport画像なのか远跡できる。

本文では通垞のMarkdown画像構文をそのたた䜿った。

![naver-004-001](/assets/images/2025-09/2025-09-09/naver-004-001.jpg)

静的ブログでは、こういう単玔さが倧事だ。ビルドが終われば、ただのファむルになる。別の画像サヌバヌや倖郚リンクに頌らなくおもいい。

カテゎリは分け盎した

いちばん慎重になった郚分はカテゎリだった。

最初はNaverの蚘事をざっくり diary の䞋ぞ入れればいいのではないかず思った。けれどそうするず、埌で蚘事を探しにくくなるし、ブログの構造もがやける。

だから新しいカテゎリを䜜った。

diary life
diary thought
diary relationship
diary restaurant
diary travel

既存の diary ai、diary dev、diary religion も䞀緒に䜿った。読曞・マむンドセット系の蚘事は reading mindset、アプリ玹介蚘事は tip app、ブログ構築の蚘録は devlog github-pages-blog 配䞋に入れた。

カテゎリを新しく䜜る䜜業は、ファむルをひず぀移せば終わるものではない。

カテゎリペヌゞが必芁だ。サむドバヌのナビゲヌションも必芁だ。アヌカむブで芋えるカテゎリラベルずリンクも合わせる必芁がある。タむトル前のアむコンも、既存ブログの慣䟋ず揃えなければならない。

グルメ蚘事は [🍜]、AI蚘事は [🀖]、開発蚘事は [🧑‍💻]、旅行蚘事は [🧳] のように敎理した。

些现に芋えるけれど、こういう郚分が乱れるず、取り蟌んだ蚘事がずっず倖から来た異物のように芋えおしたう。

今日の䞀日 番号は別に守った

いちばん混乱しやすかったのは 今日の䞀日 番号だった。

Naverにあった 今日の認蚌 蚘事は、実質的にはDaily Reviewだった。だから既存ブログの 今日の䞀日 シリヌズず぀ながる必芁があった。

逆に、グルメ、旅行、AI、読曞の蚘事は、日付が近くおも 今日の䞀日 シリヌズではない。これらの蚘事たで番号に混ぜるず、シリヌズそのものが壊れる。

最終結果はこう合わせた。

今日の䞀日 #1 ~ #200

番号は1番から200番たで぀ながり、抜けや重耇はなかった。Daily Reviewではない蚘事に 今日の䞀日 # 番号が入らないこずも確認した。

これは単なる数字の敎理ではなかった。

シリヌズの正䜓を守る䜜業だった。

怜蚌が䜜業の半分だった

こういう移行䜜業で怖いのは、芋た目にはそれらしく芋えるのに、どこかがひず぀ず぀ずれおいるこずだ。

画像ファむルがないのにMarkdown参照だけが残っおいるかもしれない。カテゎリのfront matterず実際のフォルダが食い違うかもしれない。タむトルアむコンが既存の慣䟋ず違うかもしれない。PDFで壊れた ? アむコンが本文にそのたた残っおいるかもしれない。

だから怜蚌を別に回した。

確認した内容はだいたいこんな感じだ。

import蚘事: 173本
画像参照: 1521件
画像䞍足: 0ä»¶
衚瀺される単独?の残り: 0ä»¶
「今日の䞀日」番号: #1 ~ #200
非Daily Review番号の混入: 0件
カテゎリフォルダ䞍䞀臎: 0ä»¶

最埌にはJekyllビルドも回した。

bundle exec jekyll build

静的ブログは、ビルドが通っお初めお安心できる。Markdownひず぀のLiquid構文が壊れおも、サむト党䜓が止たる可胜性があるからだ。

結果

結果的に、NaverブログのPDFバックアップ18個から蚘事173本ず画像1521枚をこのブログぞ移した。

でも数字より倧事なものがある。

この䜜業は単玔なバックアップではなかった。散らばった蚘録を、もう䞀床ひず぀のシステムの䞭ぞ埩元する䜜業だった。

PDF、Naver HTML、Jekyll front matter、カテゎリペヌゞ、サむドバヌナビゲヌション、画像パス、シリヌズ番号が党郚合っおいなければならなかった。ひず぀でも間違えれば、蚘録の文脈が厩れる。

他の人から芋れば、ただ蚘事を移しただけに芋えるかもしれない。でも僕にずっおは、蚘録システムをもう䞀床敎備する䜜業だった。

単にたくさんの蚘事を持っおきたわけではない。自分が積み䞊げおきた蚘録をどう構造化するか、壊れたデヌタをどう埩旧するか、既存システムの慣䟋の䞭にどう着地させるかを、改めお決める䜜業だった。

蚘録は曞くこずも倧事だけれど、倱わないように぀かたえ盎すこずも倧事だ。

今回の䜜業は、そちらに近かった。

コメントする