以前Bloggerに忍者ブログから記事をインポートするまでを綴りました。
http://yulllogiccc.blogspot.jp/2011/10/blog-post_1238.html
http://yulllogiccc.blogspot.jp/2011/11/blogger.html
本日、何故か存在を忘れていたfc2ブログを発見したのでまたもインポート。
前回書いた内容とあまり変わりませんが、気をつけるべきことがわかったのでメモ。
いやもう同じこと何度もやりたくはないんだけど。
大まかな流れは以前と同じです。
1.fc2ブログからエクスポート(.txtで出てきます)
2.エクスポートファイルの日時を直し(この時点で一応文字コードをUTF-8にして)、movabletype2bloggerでBlogger対応ファイルに
3.Blogger対応ファイルを開いて一括で
Z</ns0:updated>で検索→+09:00</ns0:updated>に置換
Z</ns0:published>で検索→+09:00</ns0:published>に置換
4.Bloggerに読ませて終了
2のエクスポートファイルの日時を直し、というのは以前の記事にも書いたのですが、そこでちょっと詰まりました。
以前参考にさせてもらった記事には例として「21:(..):(..)」→「09:$1:$2△PM」※△は半角スペース、とあったのですが、21時から始めると、朝の9時に書かれた記事を探すときにすでに置換された「09:(..):(..) PM」が検索に引っかかってきてしまうのですね。
なので正規表現で
「00:(..):(..)」→「00:$1:$2 AM」
からはじめるのがいいんだな、と…。そうするとすでに置換されている時間とはかぶらないので。
自分は正規表現はほとんど覚えてないので、除外するための表現があるのかもしれませんがわからない。のでそういう結論になりました。
というかこれ前にやったときもたぶんひっかかったんですが、なんで書いて置かなかったんだろう…。
で、日時を直してBlogger対応ファイルにしたのを読み込ませたところ、何故か3つ、記事が本日の日付になっていることを確認。
見てみるとエクスポートしたファイルでは正しい日時なのにBlogger対応ファイルにしたときに本日の日付、が入ってしまっている。
なんでかな?と思ったんですがたぶんファイルが多すぎるせい…なきがします。特に他に問題はなかったので。
fc2からエクスポートしたファイルと付き合わせて日時を直し、再度Bloggerにインポート。
こういうエラーがでたりするので、最初にインポートする際、インポートした記事を公開、のチェックは外しておくべきかなーと思いました。
その後fc2で付けていたタグがそのまま反映されたのですが、それが多すぎる為、インポート済の記事に「fc2から」のラベルをつけて、以前からのタグを消し、終了しました。
このタグ消しも結構面倒だったんですけど、
(一度「fc2」のラベルをつけて、なんか気に食わなかったのでラベル抽出で「fc2から」をつけ、「いらないラベル抽出→すべてにチェック→いらないラベルを選択して消す」でいいはずなんですが、量が多いと複数ページにまたがるせいなのか最終ページまで行ってから選択しないと消えなかった…)
(Bloggerに元々あるラベル「まいにちいろいろ」にfc2にあったタグ「日々」を結合しようとして「日々」で抽出→「まいにちいろいろ」ラベルをつける、と元からあった「まいにちいろいろ」の記事に「日々」ラベルがついちゃう、とか)
まあそのへんはエクスポート前にいじっておくとかのほうが楽なのかもしれません。
fc2の方のブログを消すかどうかはまだちょっと迷ってますが、とりあえずインポートしておくか、という気持ちでインポートしてみました。
前よりは…前よりは早くできたよ、うん。慣れた。
分からなくなりそうなのでこの記事と以前の2記事はブログ移行のラベルをつけておくことにします。
2012年5月2日水曜日
2011年11月3日木曜日
忍者ブログからBlogger,そのに。
その一とかその前の記事に付けてないですけどそのに。
ごはんのことうっすら時々書いてたブログをこの「あしたまでまて」に追加しました。
エクスポート→インポート作業は以前といっしょ。
ただ、あのこちらの記事にある3.のところ。
http://dtl.blog4.fc2.com/blog-entry-1088.html
逐一<ns0:published>と<ns0:updated>で検索して、日付のあとにあるZを手動で置換する、ということをやっていたんですが、
Z</ns0:updated>で検索→+09:00</ns0:updated>に置換
Z</ns0:published>で検索→+09:00</ns0:published>に置換
で一括でできますね。ということを手動置換やってる間に気が付きました。まあもっとはやく気付けという話なのですが、あの、このブログ主はちょっと頭がゆるいので…。
新しいブログのインポート前に、一応Bloggerの内容をエクスポートしましたが、インポート時の注意に出るようにちゃんと今までの記事と結合されました。
自分はごはんのブログを別に持っていたので、記事にごはんタグをインポート後に付けてから公開、としたので一気に結合された場合どういう感じなのかはちょっとわからないですけどまあ結合するよって言ってるし変わらないでしょう。
あ、でも一個前でインポートされない不思議記事、のことを書きましたが、今回は短くてもてすてすとか書いててもちゃんとインポートされてました。
せっかくだからその記事は残してあります。
http://yulllogiccc.blogspot.com/2010/10/blog-post_3722.html
http://yulllogiccc.blogspot.com/2010/10/blog-post_5721.html
この二記事は消えちゃうかな?って思ってたけど消えなかった。
三記事目も残ってるので…結局前回インポートしたときには何がいけなかったんだろう?
よく…わかりません。いっぺんにインポートできる容量制限、とかだったのかなあ…?
ごはんのことうっすら時々書いてたブログをこの「あしたまでまて」に追加しました。
エクスポート→インポート作業は以前といっしょ。
ただ、あのこちらの記事にある3.のところ。
http://dtl.blog4.fc2.com/blog-entry-1088.html
逐一<ns0:published>と<ns0:updated>で検索して、日付のあとにあるZを手動で置換する、ということをやっていたんですが、
Z</ns0:updated>で検索→+09:00</ns0:updated>に置換
Z</ns0:published>で検索→+09:00</ns0:published>に置換
で一括でできますね。ということを手動置換やってる間に気が付きました。まあもっとはやく気付けという話なのですが、あの、このブログ主はちょっと頭がゆるいので…。
新しいブログのインポート前に、一応Bloggerの内容をエクスポートしましたが、インポート時の注意に出るようにちゃんと今までの記事と結合されました。
自分はごはんのブログを別に持っていたので、記事にごはんタグをインポート後に付けてから公開、としたので一気に結合された場合どういう感じなのかはちょっとわからないですけどまあ結合するよって言ってるし変わらないでしょう。
あ、でも一個前でインポートされない不思議記事、のことを書きましたが、今回は短くてもてすてすとか書いててもちゃんとインポートされてました。
せっかくだからその記事は残してあります。
http://yulllogiccc.blogspot.com/2010/10/blog-post_3722.html
http://yulllogiccc.blogspot.com/2010/10/blog-post_5721.html
この二記事は消えちゃうかな?って思ってたけど消えなかった。
三記事目も残ってるので…結局前回インポートしたときには何がいけなかったんだろう?
よく…わかりません。いっぺんにインポートできる容量制限、とかだったのかなあ…?
2011年10月29日土曜日
忍者ブログから移転しました
忍者ブログが邪魔なところに広告を出すようになったのでBloggerに移行してきました。
ものすごく…めんどうでした…。
もうやりたくないけどもう一つある忍者のブログを統合してしまおうかなと思っているので個人的にメモしておきます。
忍者ブログはいまのところMT形式でエクスポートできるけど、MT形式はBloggerに直接読ませられないので、読ませられる形式にするところからはじまりました。
movabletype2blogger
ここでMT形式をxml形式にできるんだけど、忍者ブログの吐くファイルをそのまま入れてもエラーがでます。
何がいけないって日時形式がいけないんだそうで。
忍者ブログは月/日/年の部分はいいんだけども、時間のところが24時間表記のファイルなのでそれをAM/PMの付く12時間表記にしないといけない…のです。
それが簡単にできるツールを紹介しているサイトさんもあったんですが、自分の環境(MacOSX)では動かなかったので、正規表現を調べて置換しようかと思ったけど、自分正規表現はさっぱりなので無理でした。調べてみたけどわからなかった。
このへんでもうちょっとこのファイルを読ませるのは無理なんじゃないかと思い出して他のブログサービスに一度移行させてファイルエクスポートしたりしました。
FC2とJUGEMに移行→エクスポートをしてみたけど挫折。
FC2はMT形式でエクスポートできるんだけど、忍者ブログで折りたたんで続きを書いてた記事が折りたたみの部分だけ切れてしまう。(すべてダウンロード、の場合しか試してないですけど)あ、あと日時はやっぱり24時間表記でした。
JUGEMはエクスポート自体がうまくいかなかった。ブログを作ったばかりのせいか白紙のファイルが出てきてしまったのですね。
で、どうにか時間の部分だけ変えればいいんだよなーって思いながら検索して(記事が少ないからその検索してる間に自力で打ちなおしたほうが絶対早かったんだけどさ!)
http://dtl.blog4.fc2.com/blog-entry-1088.html
http://www.kuribo.info/2006/04/0.html
こちら二つの記事を参考に、なんとかこうして移転に漕ぎ着けたわけです。
日時形式を変えればMT→xml変換はできるんだけど、それをそのままBloggerさんに読ませると投稿日時がちょっとずれちゃうらしいですね。
あとAM0時が設定としてないっていうのもポイントみたい。下のほうの記事に書いてありますが、夜中0時はAM12:00、ってことらしいです。
それでえっとなんとか移転はできたんですが、不思議なことがいっこ。
自分忍者ブログのほうで投稿テストのためにいくつか短い、「てすとてすと」みたいな本文を書いた記事を公開してあったんですが、それはBloggerさん読み込んでくれませんでした。
忍者ブログからエクスポートしたファイルにも、変換したxmlのほうにもちゃんと記述はあるんだけど、Bloggerさんにインポートさせると、あとかたもないのです。
記事が短すぎるからか、それともてすと、だけみたいな文章は弾いてるのかな?
数えてみたら3記事ぶん、テスト投稿の部分だけきっちりインポートされてないのでした。ふっしぎー。
まだ画像とかは忍者ブログにあるのをひっぱってきてますがそれも後々直そうと思います。
きょうはもうおしまい。つっかれたー。
ものすごく…めんどうでした…。
もうやりたくないけどもう一つある忍者のブログを統合してしまおうかなと思っているので個人的にメモしておきます。
忍者ブログはいまのところMT形式でエクスポートできるけど、MT形式はBloggerに直接読ませられないので、読ませられる形式にするところからはじまりました。
movabletype2blogger
ここでMT形式をxml形式にできるんだけど、忍者ブログの吐くファイルをそのまま入れてもエラーがでます。
何がいけないって日時形式がいけないんだそうで。
忍者ブログは月/日/年の部分はいいんだけども、時間のところが24時間表記のファイルなのでそれをAM/PMの付く12時間表記にしないといけない…のです。
それが簡単にできるツールを紹介しているサイトさんもあったんですが、自分の環境(MacOSX)では動かなかったので、正規表現を調べて置換しようかと思ったけど、自分正規表現はさっぱりなので無理でした。調べてみたけどわからなかった。
このへんでもうちょっとこのファイルを読ませるのは無理なんじゃないかと思い出して他のブログサービスに一度移行させてファイルエクスポートしたりしました。
FC2とJUGEMに移行→エクスポートをしてみたけど挫折。
FC2はMT形式でエクスポートできるんだけど、忍者ブログで折りたたんで続きを書いてた記事が折りたたみの部分だけ切れてしまう。(すべてダウンロード、の場合しか試してないですけど)あ、あと日時はやっぱり24時間表記でした。
JUGEMはエクスポート自体がうまくいかなかった。ブログを作ったばかりのせいか白紙のファイルが出てきてしまったのですね。
で、どうにか時間の部分だけ変えればいいんだよなーって思いながら検索して(記事が少ないからその検索してる間に自力で打ちなおしたほうが絶対早かったんだけどさ!)
http://dtl.blog4.fc2.com/blog-entry-1088.html
http://www.kuribo.info/2006/04/0.html
こちら二つの記事を参考に、なんとかこうして移転に漕ぎ着けたわけです。
日時形式を変えればMT→xml変換はできるんだけど、それをそのままBloggerさんに読ませると投稿日時がちょっとずれちゃうらしいですね。
あとAM0時が設定としてないっていうのもポイントみたい。下のほうの記事に書いてありますが、夜中0時はAM12:00、ってことらしいです。
それでえっとなんとか移転はできたんですが、不思議なことがいっこ。
自分忍者ブログのほうで投稿テストのためにいくつか短い、「てすとてすと」みたいな本文を書いた記事を公開してあったんですが、それはBloggerさん読み込んでくれませんでした。
忍者ブログからエクスポートしたファイルにも、変換したxmlのほうにもちゃんと記述はあるんだけど、Bloggerさんにインポートさせると、あとかたもないのです。
記事が短すぎるからか、それともてすと、だけみたいな文章は弾いてるのかな?
数えてみたら3記事ぶん、テスト投稿の部分だけきっちりインポートされてないのでした。ふっしぎー。
まだ画像とかは忍者ブログにあるのをひっぱってきてますがそれも後々直そうと思います。
きょうはもうおしまい。つっかれたー。
登録:
投稿 (Atom)