在boto3 client.copy中,如何用密钥地址的更新版本替换密钥?

问题描述

我正在将大量文件一个S3帐户移至另一个帐户,并且某些文件存在一些问题。

在S3中,我有一些文件名,末尾带有一些奇怪的字符。心中的小照片还是100!管他呢。像这样:

enter image description here

在看了太久的东西之后,我认为像这样的键有问题。 S3中的实际对象网址看起来像

https://infoYouDoNotNeed+Resume%F0%9F%92%9B%F0%9F%92%9A%E2%9D%A4.docx

但是如果我打印copy_source,则密钥看起来像

'Key': u'notNeededInfo\U0001f49b\U0001f49a\u2764.docx'

当我运行脚本时,在终端中看到以下错误

An error occurred (InvalidRequest) when calling the copyObject operation: Couldn't parse the specified URI.

我想像99%的人肯定这与该键有关,但是我还无法弄清楚如何解决它。我已经尝试过使用urllib,进行编码,解码,替换,但是似乎没有任何东西可以将它传递到要复制的s3.Meta.client.copy函数中的地址。

以下是相关代码

def get_versions(bucket_object_key):
    # get a list of versions for the object
    response = source_client.list_object_versions(
        Bucket=args.source,Prefix=bucket_object_key
    )
    # this needs to go in reverse order
    # for each version in order from first entered to most recent...
    for version in response['Versions'][::-1]:
        # get the key
        v_key = version['Key']
        # encode v_key to ignore out of bounds ascii characters
        new_key = version['Key'].encode('ascii','ignore')
        # get the versionId
        v_id = version['VersionId']
        try:
            # set the arguments for the source,filename,and version
            copy_source = {
                'Bucket': args.source,'Key': v_key,'VersionId': v_id
            }
            print copy_source
            # copy the file/version to the destination bucket
            s3.Meta.client.copy(
                copy_source,dest_bucket,new_key
            )
            # Log the success
            logging.info('File %s copied,version %s' % (v_key,v_id))
            dest_object = dest_client.get_object(
                Bucket=args.dest,Key=new_key
            )
            new_v_id = dest_object['VersionId']
            logging.info('%s New versionId %s' % (v_key,new_v_id))
            print('copy of %s version %s successful' % (v_key,v_id))

        except ClientError as e:
            # log the failure
            logging.error('Error copying %s,version %s' % (key,v_id))
            print 'Error copying {} {}'.format(
                key.encode('ascii','ignore'),v_id
            )
            print e

我希望就如何进行这项工作提出一些建议,因为有很多精神病患者的简历(我假设他们是对我这样做的)。可能是招聘人员这样做的,但无论哪种方式,有人将这些图片放在了那里,我需要将这些文件移动到其他地方。

解决方法

您可以将目标Key设置为:

Key=''.join([c for c in new_key if c in string.printable])

请务必先import string