问题描述
对于我来说,Python仍然是一门难懂的语言..T_T 我真的需要你的帮助。
我正在尝试抓取一些网站。 网站网址的末尾有四位数,如下所示。
URL→http://www.boanjob.co.kr/work/employ_detail.html?no=**2196* *
所以我编写了以下代码。
import pandas as pd
import datetime
df_list = [pd.read_html(f'http://www.boanjob.co.kr/work/employ_detail.html?no={number}')[25] for number in range(2196,2300)
df = pd.concat(df_list).reset_index(drop=True)
df = df.transpose() #I have to change rows and columns.
df = df.dropna(axis=0,how='all').dropna(axis=1,how='all')
# df.columns = ['A','B','C','D','E','F','G','H']
print(df)
它在2196、2198、2199、2200等中都能很好地工作。
但是,2197是不存在的页面,
因此它会发送一条错误消息,并返回到主屏幕。
(For循环以2197结尾。)
是否可以跳过此页面上的工作
(出现错误消息的页面)并转到下一个数字2198?
我对Python很困惑。
请再一次帮助我... T_T
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)