Как сделать цикл, который просматривает все column_B для первого значения в столбце a, и удаляет не найденное совпадение?
Мне нужно перебрать свои данные таким образом, чтобы первое значение в столбце А было проверено на соответствие всем значениям в столбце В, а после того, как оно не вернулось, было удалено. Мне это нужно, потому что мне нужен каскадный эффект, то есть: удаление одной строки удалит нежелательное значение из столбца B и не даст "ложного срабатывания" позже в цикле. Это заняло у меня более 25 часов работы, и это убивает меня, я действительно нуждаюсь в ответе. Спасибо. Вот что у меня есть, но это не удаляет ненужные строки.
Мои нынешние подходы были таковы:
Что я уже пробовал:
импорт включает в себя как НП
импорт панд в качестве ПД
из pandas import read_excel
ДФ = др.read_csv(Р'/пользователи/manroy/загрузки/bom_slice., сентября=',', dtype={'BOMB_ID': стр 'последовательность': стр, "номенклатура": стр 'Next_BOM' CSV' с: ул. })
печать(df.head())
импорт заново
df['drop'] = df.BOM_ID.isin(df.Next_BOM).astype(int)
df = df.loc [~((df['drop'] == 0))]
по строке ДФ:
если df['drop'] == 0:
df.drop(строка)
If I use the first method of adding a boolean column, then I need it to loop so that it automatically updates the original df and creates new bool values. There are over 900,000 rows in this data frame, so this has to be automated. Either way, I need the dataframe to update immediately because I need a "cascading" effect. Thank you.