问题描述
我正在应用 Silge 和 Robinson 的“使用 R 进行文本挖掘:一种整洁的方法”进行主题建模。
没有显示如何绘制图 3.6,显示了“在 主题2和主题1之间的β"。
我在互联网上进行了搜索,包括通过从零开始同时应用排名、降序和升序来对值进行子集化的方法。
最好的问候
解决方法
创建“beta_wide”对象后,您应用此代码:
beta_wide %>%
group_by(log_ratio > 0) %>%
top_n(10,abs(log_ratio)) %>%
ungroup() %>%
ggplot(aes(fct_reorder(term,log_ratio),log_ratio,fill = log_ratio > 0)) +
geom_col(alpha = 0.8,show.legend = FALSE) +
coord_flip() +
theme_minimal() +
labs(x = "words",y = "log2 ratio of beta in topic 2 /topic 1") +
scale_fill_brewer(palette = "Set1")
您可以通过将 10 更改为 -10 来绘制差异最小的单词。