问题描述
我正在执行一个简单的二进制文本分类,并且我的标签数据已经采用0和1格式。我想知道是否仍然需要执行一次热编码,以便它们处于[0,1 ]和[1,0]格式?
当我将标签以Sequential()
的形式输入到Keras <class 'numpy.ndarray'>
模型中时,它可以在模型中使用,并且获得了不错的准确性。但是我仍然想知道是否应该对它们进行一次热编码吗?
解决方法
它对二进制情况没有帮助,因为二进制列已经有两个值。如果您将二进制文件编码为两列,则会在没有信息的列中再增加一个额外的二进制列。
因此,对二进制列进行热编码是没有意义的,并且会在您的上下文中造成不必要的冗余。