2012年5月2日水曜日

fc2ブログからBloggerにインポート

以前Bloggerに忍者ブログから記事をインポートするまでを綴りました。
http://yulllogiccc.blogspot.jp/2011/10/blog-post_1238.html
http://yulllogiccc.blogspot.jp/2011/11/blogger.html

本日、何故か存在を忘れていたfc2ブログを発見したのでまたもインポート。
前回書いた内容とあまり変わりませんが、気をつけるべきことがわかったのでメモ。
いやもう同じこと何度もやりたくはないんだけど。

大まかな流れは以前と同じです。
1.fc2ブログからエクスポート(.txtで出てきます)
2.エクスポートファイルの日時を直し(この時点で一応文字コードをUTF-8にして)、movabletype2bloggerでBlogger対応ファイルに
3.Blogger対応ファイルを開いて一括で
Z</ns0:updated>で検索→+09:00</ns0:updated>に置換
Z</ns0:published>で検索→+09:00</ns0:published>に置換
4.Bloggerに読ませて終了

2のエクスポートファイルの日時を直し、というのは以前の記事にも書いたのですが、そこでちょっと詰まりました。
以前参考にさせてもらった記事には例として「21:(..):(..)」→「09:$1:$2△PM」※△は半角スペース、とあったのですが、21時から始めると、朝の9時に書かれた記事を探すときにすでに置換された「09:(..):(..) PM」が検索に引っかかってきてしまうのですね。
なので正規表現で
「00:(..):(..)」→「00:$1:$2 AM」
からはじめるのがいいんだな、と…。そうするとすでに置換されている時間とはかぶらないので。
自分は正規表現はほとんど覚えてないので、除外するための表現があるのかもしれませんがわからない。のでそういう結論になりました。
というかこれ前にやったときもたぶんひっかかったんですが、なんで書いて置かなかったんだろう…。

で、日時を直してBlogger対応ファイルにしたのを読み込ませたところ、何故か3つ、記事が本日の日付になっていることを確認。
見てみるとエクスポートしたファイルでは正しい日時なのにBlogger対応ファイルにしたときに本日の日付、が入ってしまっている。
なんでかな?と思ったんですがたぶんファイルが多すぎるせい…なきがします。特に他に問題はなかったので。
fc2からエクスポートしたファイルと付き合わせて日時を直し、再度Bloggerにインポート。
こういうエラーがでたりするので、最初にインポートする際、インポートした記事を公開、のチェックは外しておくべきかなーと思いました。

その後fc2で付けていたタグがそのまま反映されたのですが、それが多すぎる為、インポート済の記事に「fc2から」のラベルをつけて、以前からのタグを消し、終了しました。
このタグ消しも結構面倒だったんですけど、
(一度「fc2」のラベルをつけて、なんか気に食わなかったのでラベル抽出で「fc2から」をつけ、「いらないラベル抽出→すべてにチェック→いらないラベルを選択して消す」でいいはずなんですが、量が多いと複数ページにまたがるせいなのか最終ページまで行ってから選択しないと消えなかった…)
(Bloggerに元々あるラベル「まいにちいろいろ」にfc2にあったタグ「日々」を結合しようとして「日々」で抽出→「まいにちいろいろ」ラベルをつける、と元からあった「まいにちいろいろ」の記事に「日々」ラベルがついちゃう、とか)
まあそのへんはエクスポート前にいじっておくとかのほうが楽なのかもしれません。

fc2の方のブログを消すかどうかはまだちょっと迷ってますが、とりあえずインポートしておくか、という気持ちでインポートしてみました。
前よりは…前よりは早くできたよ、うん。慣れた。
分からなくなりそうなのでこの記事と以前の2記事はブログ移行のラベルをつけておくことにします。

0 件のコメント:

コメントを投稿