问题描述
我正在创建一个包含许多库存项目的库存表。每只股票都有多个数据,我正在从多个网站抓取这些数据。
当前,随着工作表的不断增加,我开始遇到无法执行IMPORTXML
和IMPORTHTML
函数的问题。
问题:可以将整个网页的源代码一次导入到一个单元格中,然后我可以运行IMPORTHTML
/ IMPORTXML
将该单元格作为源?我正在考虑,因为在这种情况下,我只需要调用该特定页面一次,然后处理工作表本身内的所有不同数据即可。
任何想法,谢谢!
解决方法
要导入源代码,可以使用IMPORTDATA
公式。取决于您的网站结构,您可能需要ArrayConstrain:
=ARRAY_CONSTRAIN(IMPORTDATA("url-here"),5000,25)
,
使用Google Apps脚本代替内置公式。
以上是因为没有内置功能可按原样导入数据
- IMPORTDATA将用逗号和换行符分隔源代码
- IMPORTXML不会导入标签,而只会导入其中包含的文本。
- 仅IMPORTHTML导入表和列表的内容
另一方面,以上功能不能用于解析单元格中的数据,唯一能够解析通过URL引用的外部源中的内容。
关于Google Apps脚本的使用,它具有taking