使用Iso-8859-1编码的主题进行Python IMAP搜索

问题描述

| 我从另一个帐户给自己发送了一封电子邮件主题为“ 0”。现在使用IMAP,我想找到按主题搜索的电子邮件搜索
ALL
并在输出中找到电子邮件时,我看到:
Subject: =?ISO-8859-1?Q?Test_de_r=E9ception_en_local?=
所以现在,使用imap搜索,我尝试:
M = imaplib.IMAP4_SSL(\'imap.gmail.com\',993)
M.login(\'user@gmail.com\',\'password\')
M.select(\'[Gmail]/All Mail\')

subject = Header(email_model.subject,\'iso-8859-1\').encode() #email_model.subject is in unicode,utf-8 encoded
typ,data = M.search(\'iso-8859-1\',\'(SUBJECT \"%s\")\' % subject)
for num in data[0].split():
    typ,data = M.fetch(num,\'(RFC822)\')
    print \'Message %s\\n%s\\n\' % (num,data[0][1])
M.close()
M.logout()

print \'Fin\'
如果打印出
subject
,您会发现结果与我以前进行更广泛的搜索时从IMAP服务器获得的结果完全相同。但是,在进行更具体的搜索时,似乎没有找到匹配的结果。 对于搜索,我尝试了所有可以想到的方法
typ,\'(HEADER subject \"%s\")\' % subject)
typ,\'ALL (SUBJECT \"%s\")\' % subject)
还有我目前无法回忆的其他一切,没有任何运气。 我可以搜索(并匹配)具有仅使用ASCII主题的电子邮件,但不适用于已应用编码的任何主题。所以... 使用IMAP,使用已应用编码的主题搜索电子邮件的正确方法是什么? 谢谢     

解决方法

与IMAP服务器通信时,请使用IMAP RFC进行检查。 您必须删除多余的引号,并且不能对字符串进行编码。同样,字符集指定搜索查询的字符集,而不是消息头的字符集。这应该工作(为我工作):
M.search(\"utf-8\",\"(SUBJECT %s)\" % u\"réception\".encode(\"utf-8\"))
# this also works:
M.search(\"iso8859-1\",\"(SUBJECT %s)\" % u\"réception\".encode(\"iso8859-1\"))
编辑: 显然,某些服务器(截至2013年8月至少为gmail)仅在以文字形式发送时才支持utf-8字符串。 Python imaplib对文字参数的支持非常有限,最好的方法是:
term = u\"réception\".encode(\"utf-8\")
M.literal = term
M.search(\"utf-8\",\"SUBJECT\")
    

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...