Extract javascript information from url with python
我有一个链接到javascript文件的URL,例如
是否可以使用python执行此操作?
目前我正在使用
1 2 3 | U?(??%y?d?<?!???P??&Y??iX???O???????<Xy?CH{]^7e? ?K?\??h??,U(9 i?A ??2dp}?9???t?<M?M,u?N??h?b??uV?\??0?A1??Q?.)?A??XNc??$"SkD?y????5?)?B?t9?):?^6??`(???d??hH=9D5wwK'?E?j%?]U~??0U?~???)?pj??aA??;n?px`?r?/8<?;?t??z?{??n??W ?s???????h8????i??#}???}&?M?K?y??h?z?6,?Xc??!:'D|?s??,?g$?Y??H?T^#`r????f????tB??7??X?%?.X\??M9V[Z?Yl?LZ[ZM?F???`D?=?5?A?0?){Ce?L*?k?????????5????"?A??Y?}???t??X?(?O???[?{???T?V???:?s?i?????8m??6b??d$??j}??u?D&RL?[0>~x?j?7? |
当我查看开发工具来查看DOM时,正文中唯一的东西就是包含在标签中的字符串。 在常规视图中,字符串是json元素。
我建议改用
1 2 3 4 | import requests r = requests.get('https://something.com/x.js') r.text # unparsed json output, shouldn't be garbled r.json() # parses json and returns a dictionary |
一般来说,
1 2 3 4 | import json js = urllib2.urlopen("http://something.com/../x.js").read() data = json.loads(js) |