python解决格式和乱码兼容问题,还是colab的jupyter book方便

python3.8和3.7版本代沟很大,很多版本问题,特别是python2和python3的版本问题可以使用apt-get install 2to3 解决,使用方法2to3 -w caiji.py命令可以自动备份已经升级版本,但是很多库问题是没版本解决的,比如python2的新闻解析库newspaper 在python3的库就是newspaper3k还有就是urllib和urllib2还有就是安装运行的程序环境一定要记得建一个requirements.txt把需要的库和版本都写进去,比如
lxml==4.6.4
python-wordpress-xmlrpc==2.3
newspaper3k==0.2.8
jieba3k==0.35.1
http.client==0.1.22
httplib2==0.14.0
urllib3==1.25.8
requests==2.22.0
不知道当前版本可以使用 pip3 list查看库的具体版本,版本太高就卸载pip3 uninstall lxml 然后再安装pip3 install lxml==4.6.4
也可以在https://pypi.org/project/lxml/中查看版本号和年份。根据时间推断之前运行的正常的版本时间和对应的版本号。
关于chinanews.com已经开始建立了反爬机制,可能需要使用pip install fake-useragent或者
pip install requests-random-user-agent
自动调用