挖掘“包含在”条目中而不是“等于”的术语

问题描述

我正在做一些数据挖掘。我有一个看起来像这样的数据库(拉出三行):

100324822$10032482$1$PS$BENICAR$OLMESARTAN MEDOXOMIL$1$Oral$UNK$$$Y$$$021286$$$TABLET$ 1014687010$10146870$2$SS$BENICAR HCT$氢氯噻嗪\OLMESARTAN MEDOXOMIL$1$Oral$1/2 of 40/25MG 片剂$$Y$$$$$.5$DF$薄膜包被片剂$QD 115700162$11570016$5$C$Olmesartan$OLMESARTAN$1$Unknown$UNK$$$U$U$$$$$$$

我的代码如下所示:

    with open('DRUG20Q4.txt') as fileDrug20Q4:
        drugTupleList20Q4 = [tuple(map(str,i.split('$'))) for i in fileDrug20Q4]
    drug20Q4 = []
    for entryDrugPrimaryID20Q4 in drugTupleList20Q4:
        drug20Q4.append((entryDrugPrimaryID20Q4[0],entryDrugPrimaryID20Q4[3],entryDrugPrimaryID20Q4[5]))
    fileDrug20Q4.close()

    drugNameDataFrame20Q4 = pd.DataFrame(drug20Q4,columns = ['PrimaryID','Role','Drug Name']) drugNameDataFrame20Q4 = pd.DataFrame(drugNameDataFrame20Q4.loc[drugNameDataFrame20Q4['Drug Name'] == 'OLMESARTAN'])

目前,代码只会提取具有确切名称“OLMESARTAN”的条目,我如何捕获所有变体,例如“OLMESARTAN MEDOXOMIL”等?我不能简单地列出所有的品种,因为有无数的变化,所以我需要一些东西来捕捉其中包含“OLMESARTAN”一词的任何东西。

谢谢!

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)