python解决格式和乱码兼容问题,还是colab的jupyter book方便-泓源视野

python解决格式和乱码兼容问题,还是colab的jupyter book方便

python3.8和3.7版本代沟很大,很多版本问题,特别是python2和python3的版本问题可以使用apt-get install 2to3 解决,使用方法2to3 -w caiji.py命令可以自动备份已经升级版本,但是很多库问题是没版本解决的,比如python2的新闻解析库newspaper 在python3的库就是newspaper3k还有就是urllib和urllib2还有就是安装运行的程序环境一定要记得建一个requirements.txt把需要的库和版本都写进去,比如

lxml==4.6.4
python-wordpress-xmlrpc==2.3
newspaper3k==0.2.8

jieba3k==0.35.1
http.client==0.1.22

httplib2==0.14.0

urllib3==1.25.8

requests==2.22.0

不知道当前版本可以使用 pip3 list查看库的具体版本,版本太高就卸载pip3 uninstall lxml 然后再安装pip3 install lxml==4.6.4

也可以在https://pypi.org/project/lxml/中查看版本号和年份。根据时间推断之前运行的正常的版本时间和对应的版本号。

 

关于chinanews.com已经开始建立了反爬机制,可能需要使用pip install fake-useragent或者

pip install requests-random-user-agent自动调用
本文由 泓源视野 作者:admin 发表,其版权均为 泓源视野 所有,文章内容系作者个人观点,不代表 泓源视野 对观点赞同或支持。如需转载,请注明文章来源。
8

发表评论

Protected with IP Blacklist CloudIP Blacklist Cloud
您是第8238561 位访客, 您的IP是:[3.134.104.173]