-
精简WordPress eXtended Rss (WXR) 文件格式
经过N次Import和数据库清空,终于将之前的WXR文件格式的完备集简化了。 简化原则是适应Sina2WordPress项目的需要,尽可能精简文件大小,删除了导入无效的(如博客标题、博客链接等)和从新浪博客中无法获取的(如评论者的链接和IP等)信息,还有item之前的的作者、分类和标签信息。作者在导入时可以指定的,反而加上会有可能的错误,分类和标签的信息用post中的分类和标签就可以自动统计了。没想明白为什么非要单独列出来,难道是为了空的分类和标签,那还要它干嘛? 一些必不可少的标签及错误总结: 1、wxr_version,缺少会提示“missing/invalid WXR version number”的错误 2、status,否则都会显示成draft 3、post_type,否则无法导入 4、comment_approved,否则无法导入 [xml] < ?xml version="1.0" encoding="UTF-8" ?> 1.1 Title test < ![CDATA[Content_test]]> 2002-12-21 07:59:59 open publish post 0 < ![CDATA[Tag Test]]> < ![CDATA[Category Test]]> 1 < ![CDATA[anonymous]]> 2012-12-21 07:59:59 < ![CDATA[Content of Comment]]> 1 0 [/xml]
-
WordPress eXtended Rss (WXR)文件格式解析
Sina2WordPress的第一步——解析WXR文件格式 WXR是Wordpress eXtended Rss的缩写,是WordPress针对博客信息特意设定的格式,它最大的优点是兼容性好,包含信息丰富 通过参照导出的文件,初步找到一个完备集(见下方代码),经测试在WP无任何内容情况下无信息缺漏错误现象 下方代码已经尽可能的注释了所有可能的标签和属性,并且由于一些标签和属性与Sina2WordPress关系不大,故未深究 [xml] < ?xml version="1.0" encoding="UTF-8" ?> Blog Title http://blog.example.com Blog Description Dec, 20 Jun 2012 23:59:59 +0000 en 1.1 http://example.com http://blog.example.com 1admin_testadmin@example.org< ![CDATA[AdMin test]]>< ![CDATA[AdMin]]>< ![CDATA[test]]> 1category_test< ![CDATA[分类测试]]> 2tag_test< ![CDATA[标签测试]]> http://wordpress.org/?v=3.1.3 Title http://blog.example.com/title/ Thu, 15 Apr 2010 23:20:03 +0000 admin http://blog.example.com/?page_id=1 < ![CDATA[Content_test_1]]> < ![CDATA[]]> 2 2012-12-21 07:59:5 2010-12-20…
-
A recommended kind of RSS solution
Today I want to recommend a kind of RSS solution and it’s just what I use for my blog. In this way, we will have a permanent and unique rss url. As for me, it’s http://feeds.huxuan.org/huxuan 1)Sign up as the same name for your feed in FeedSky & FeedBurner. e.g. I have http://feed.feedsky.com/huxuan for FeedSky &…