问题描述
我正在尝试从多个网站获取Contact-Us URL。以下代码不会产生任何错误,但不会产生任何输出。函数find_link产生所需的输出,但是函数contact_check不会产生任何输出。
import xlrd
import os
import re
import requests
import pandas
import sys
from sys import exit
from operator import contains
from bs4 import BeautifulSoup
from bs4.element import Comment
import urllib.request
headers = {'accept-language': 'en-GB,en-US;q=0.9,en;q=0.8',}
def tag_visible(element):
if element.parent.name in ['style','script','head','title','Meta','[document]']:
return False
if isinstance(element,Comment):
return False
return True
def find_link(url):
r = requests.get(url,headers = headers)
txt = BeautifulSoup(r.text,'lxml')
links = []
for link in txt.findAll('a'):
links.append(link.get('href'))
return r,links
def contact_check(links):
url1 = ''
match = ['contact','contact us','contact-us','Contact Us','Contact us','Contact','Contact US','contactus','ContactUS','ContactUs']
for link in links:
if (any(b in i for b in match) for i in link):
url1 = link
return url1
text = contact_check(find_link("https://www.genre.com/"))
print(text)
任何帮助将不胜感激! 谢谢!!
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)