精简WordPress eXtended Rss (WXR) 文件格式


经过N次Import和数据库清空,终于将之前的WXR文件格式的完备集简化了。

简化原则是适应Sina2WordPress项目的需要,尽可能精简文件大小,删除了导入无效的(如博客标题、博客链接等)和从新浪博客中无法获取的(如评论者的链接和IP等)信息,还有item之前的的作者、分类和标签信息。作者在导入时可以指定的,反而加上会有可能的错误,分类和标签的信息用post中的分类和标签就可以自动统计了。没想明白为什么非要单独列出来,难道是为了空的分类和标签,那还要它干嘛?

一些必不可少的标签及错误总结:
1、wxr_version,缺少会提示“missing/invalid WXR version number”的错误
2、status,否则都会显示成draft
3、post_type,否则无法导入
4、comment_approved,否则无法导入

[xml]
< ?xml version="1.0" encoding="UTF-8" ?>



1.1


Title test

< ![CDATA[Content_test]]>

2002-12-21 07:59:59

open

publish

post

0

< ![CDATA[Tag Test]]>
< ![CDATA[Category Test]]>


1

< ![CDATA[anonymous]]>

2012-12-21 07:59:59

< ![CDATA[Content of Comment]]>

1

0





[/xml]


6 responses to “精简WordPress eXtended Rss (WXR) 文件格式”

  1. 我在上传DEMO的时候出现这个错误提示:This does not appear to be a WXR file, missing/invalid WXR version number
    要怎么办?

Leave a Reply to 木子日匀 Cancel reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.