合并 TFRecord 数据集

问题描述

我有 2 个 TFRecordDatasets一个有图像和相应的嵌入。另一个具有相应的嵌入和图像特征。我想制作一个现在有图像、嵌入和特征的数据集。

d1(image,embeddings),d2(embeddings,features) ----> D(image,embeddings,features)

解决方法

TfRecordDataset 可以使用 zip 函数进行组合。 找到以下示例工作示例。

import tensorflow as tf
images = tf.data.Dataset.range(1,4)  
embeddings = tf.data.Dataset.range(4,7)  
features = tf.data.Dataset.range(7,9)
ds = tf.data.Dataset.zip((a,b,d))
for element in ds.as_numpy_iterator():
  print(element)

输出

(1,4,7)
(2,5,8)