问题描述
我正在尝试从互联网上导入一些文本,但显然Google表格无法处理动态网站。我使用了来自Chrome浏览器的Xpath。
=IMPORTXML("https://www.kite.com/python/docs/pandas.core.frame.DataFrame.sum","//*[@id='root']/div/div/div[3]/div/div/div/div[2]/section/div/code/text()")
=INDEX(IMPORTXML("https://www.kite.com/python/docs/pandas.core.frame.DataFrame.sum","//*[@id='root']/div/div/div[3]/div/div/div/div[2]/section/div/code/text()"),1;1)
欢迎任何帮助。
解决方法
我知道,您正在尝试获取“文档”文本。
您已经发现,不能简单地(m <- matrix(1:9,nrow=3))
# [,1] [,2] [,3]
# [1,] 1 4 7
# [2,] 2 5 8
# [3,] 3 6 9
(rowcols <- cbind(c(2,3,2),c(3,1,3)))
# [,2]
# [1,] 2 3
# [2,] 3 1
# [3,] 2 3
m[rowcols] <- 10:12
m
# [,] 2 5 12
# [3,] 11 6 9
来获取网站中的动态数据。相反,您需要做的是查找如何检索数据。我的第一个直觉总是检查网络监视器。我发现它正在通过HTTP GET调用ImportXML()
。响应是一个JSON,其中包含我们的数据,其路径为https://alpha.kite.com/api/editor/symbol/python;pandas.core.frame.DataFrame.sum
。
这意味着我们需要一种解析JSON数据的方法,我们可以使用Apps脚本ImportJSON
进行解析。将该脚本添加到工作表中(工具>脚本编辑器),然后:
/report/description_text
这应该给您想要的文字。