在熊猫中找到缺失值不是NaN

问题描述

我有一个按升序排列的熊猫系列。其值类似于1,2,3，...，73514,73515,73516。但是列数是73515。

我需要找到缺少的值。如何找到？

解决方法

假设列名称的类型为int，您也可以使用python集：

set(range(1,73516)).difference(set(df.columns))

或

set(range(1,73516)) - set(df.columns)

如果该值为数字，则可以尝试：

a=input("Enter your name:")

import datetime
currentTime = datetime.datetime.now()
currentTime.hour

if currentTime.hour < 12:
    print('Good morning',a)
elif 12 <= currentTime.hour < 18:
    print('Good afternoon',a)
else:
    print('Good evening',a)

[write this without using python,click this link provided below to write]

如果值是字符串：

df[df['col1'] == 0]

假设我正确理解了你

for i in range(1,73517):
    i if i not in series.to_list() else print('',end='')

它应该打印搜索到的值。

您可以使用二进制搜索算法，以将缺少的值返回给您。请检查此解决方案，然后使其适应使用熊猫： https://www.geeksforgeeks.org/find-missing-element-in-a-sorted-array-of-consecutive-numbers/

这是最有效的解决方案。与其他解决方案相比，O（logN）的执行速度要快得多，在其他解决方案中，您必须迭代从1到Series中最后一个元素的所有值的范围，并检查每个值是否在Series中，之所以使用O（N ²），是因为迭代和 in 都采用O（N）。

祝你有美好的一天！

假设您的意思是您的列表范围在1到73515之间，并且需要查找此列表中是否缺少任何值。

一种执行此操作的方法是制作一个具有所有期望值的列表例如预期=范围（1,73515）

然后您可以将期望值与列表进行比较

missing_values = []
for num in expected:
    if num not in original_list:
        missing_values.append(num)

或在列表理解中执行相同的操作：

missing_values_comprehension = [num for num in expected if num not in original_list]

很显然，您确实提到过您拥有系列中的值。您可以根据需要直接迭代这些值，也可以先将它们转换为列表。

missing-data pandas pandas python series series