如何从 Newsmap (Quanteda) 导出构建的字典

问题描述

我已经在 Newsmap 包中为 R 中的 quanteda 训练了一个新闻地图模型,并且正在尝试导出它基于我的语料库(而不是种子词典)构建的大词典。 我已经尝试过这段代码,但它只以列表格式为我提供了每个国家/地区最相关的 10 个术语,我也无法提取这些术语以形成我可以在 R 中使用的字典对象。

Dict <-coef(model)

我真的很感激任何帮助!

解决方法

您只需要提取具有传递给 n 的所需字数的向量的名称。

> quanteda::dictionary(lapply(coef(model,n = 1000),FUN = names))
Dictionary object with 226 key entries.
- [bi]:
  - burundi,burundi's,bujumbura,burundian,nkurunziza,uprona,msd,nduwimana,hutus,tutsi,radebe,drcongo,rapporteur,elderly,mushikiwabo,generation,kayumba,faustin,hutu,olga [ ... and 980 more ]
- [dj]:
  - djibouti,djibouti's,djiboutian,western-led,pretty,photo,watkins,ask,entebbe,westerners,mujahideen,salvation,osprey,persistent,horn,afdb,donors,ismael,nevis,grenade [ ... and 980 more ]
- [er]:
  - eritrea,eritreans,eritrean,keetharuth,issaias,eritrea's,binnie,sheila,somaliland,catania,mandeb,brutal,sicily's,lana,lampedusa,aman,monitoring [ ... and 980 more ]
- [et]:
  - ethiopia,ethiopian,addis,ababa,hailemariam,desalegn,ethiopians,maasho,ethiopia's,igad,dibaba,genzebe,mesfin,bekele,spla,shrikesh,laxmidas [ ... and 980 more ]
- [ke]:
  - kenya,kenyan,nairobi,uhuru,lamu,mombasa,mpeketoni,kenyans,kws,nairobi's,akwiri,ruto,westgate,kenyatta's,makaburi,kenyatta,kenya's,ol [ ... and 980 more ]
- [km]:
  - comoros,mazen,emiratis,oil-rich,canterbury,lahiya,shoukri,gender,wadia,lombok,brisbane's,entire,christiana,blahodatne,everest's,culiacan,kamensk-shakhtinsky,protestants,pk-5,parwan [ ... and 980 more ]
[ reached max_nkey ... 220 more keys ]

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...