3 5717

关于xslt编码的问题。

xiaoyuvps 于 2017-4-30 17:57 发表 [复制链接]


用MS生成了XML的规则

但是用 bbsExtra.setXsltFromFile("xslt_bbs.xml")

会提示报错

    result = bbsExtra.extract(doc)    # 调用extract方法提取所需内容
  File "/root/gooseeker.py", line 44, in extract
    xslt_root = etree.XML(self.xslt)
  File "src/lxml/lxml.etree.pyx", line 3192, in lxml.etree.XML (src/lxml/lxml.etree.c:78763)
  File "src/lxml/parser.pxi", line 1843, in lxml.etree._parseMemoryDocument (src/lxml/lxml.etree.c:118282)
ValueError: Unicode strings with encoding declaration are not supported. Please use bytes input or XML fragments without declaration.



环境Centos7 Python34
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2017-5-1 09:46

xiaoyuvps 初级会员 发表于 2017-4-30 19:10:02 | 显示全部楼层
这个问题倒是解决了。把第一行的UTF8去掉就行了。

但是问题再MS上可以测试成功的。 为啥在PYTHON里就测试不成功呢
举报 使用道具
Fuller 管理员 发表于 2017-4-30 22:46:19 | 显示全部楼层
xiaoyuvps 发表于 2017-4-30 19:10
这个问题倒是解决了。把第一行的UTF8去掉就行了。

但是问题再MS上可以测试成功的。 为啥在PYTHON里就测试 ...

这个可能跟xslt的解释器有关,我问一下python开发人员
举报 使用道具
shenzhenwan10 金牌会员 发表于 2017-5-1 09:46:09 | 显示全部楼层
如果是直接copy xslt内容,第一行的UTF8确实要去掉,不然会出错
如果是调用api,就不用专门处理第一行,api接口已经做了处理
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-28 20:32