经过N次Import和数据库清空,终于将之前的WXR文件格式的完备集简化了。
简化原则是适应Sina2WordPress项目的需要,尽可能精简文件大小,删除了导入无效的(如博客标题、博客链接等)和从新浪博客中无法获取的(如评论者的链接和IP等)信息,还有item之前的的作者、分类和标签信息。作者在导入时可以指定的,反而加上会有可能的错误,分类和标签的信息用post中的分类和标签就可以自动统计了。没想明白为什么非要单独列出来,难道是为了空的分类和标签,那还要它干嘛?
一些必不可少的标签及错误总结:
1、wxr_version,缺少会提示“missing/invalid WXR version number”的错误
2、status,否则都会显示成draft
3、post_type,否则无法导入
4、comment_approved,否则无法导入
[xml]
< ?xml version="1.0" encoding="UTF-8" ?>
[/xml]
6 responses to “精简WordPress eXtended Rss (WXR) 文件格式”
谢谢了!正需要这个啊!!
正打算写个blog搬家工具呢。多谢了~
@木子日云 我写了一个python的转换脚本,不过还不是很完善,欢迎多多交流~ http://huxuan.org/projects/sina2wordpress/
学习了。
不过暂时不会python= =
我在上传DEMO的时候出现这个错误提示:This does not appear to be a WXR file, missing/invalid WXR version number
要怎么办?
@玲珑 我猜测您是不是忘记了我在样例中贴出来的
wp:wxr_version