聚合新闻头条

确定新闻来源

有头条新闻的提取头条新闻

from requests_html import HTMLSession        #导入爬虫所需的模块

def get_news():
    ans_news_titles=[]    #定义一个空列表
    session=HTMLSession()  #创建爬虫模块对象
    r=session.get(https://news.baidu.com/)    #获取页面
    title1_baidu=r.html.find(#pane-news > div > ul > li.hdline0 > strong > a,first=True)  #查找css选择器对应的内容,
    ans_news_titles.append(title1_baidu)
    titles_baidu=r.html.find(#pane-news > ul:nth-child(n) > li.bold-item > a)
    ans_news_titles+=titles_baidu
    for title in ans_news_titles:
        print(title.text)

if __name__ == __main__:
    get_news()

相关文章

迭代器模式(Iterator)迭代器模式(Iterator)[Cursor]意图...
高性能IO模型浅析服务器端编程经常需要构造高性能的IO模型,...
策略模式(Strategy)策略模式(Strategy)[Policy]意图:定...
访问者模式(Visitor)访问者模式(Visitor)意图:表示一个...
命令模式(Command)命令模式(Command)[Action/Transactio...
生成器模式(Builder)生成器模式(Builder)意图:将一个对...