Eddie Winch Ответов: 0

Мне нужна помощь в завершении моего кода Python

Привет, у меня есть код Python, который я запускаю в Jupyter Notebook, манипулируя данными из файла документа Excel .XLS, который еще не дает желаемого результата.

Я хотел бы, чтобы правильная дата была показана в столбце дата, в
формат день месяц год, то есть 13-4-2009. Даты, которые действительно показывают, находятся в формате год месяц день, но год либо показывает, как 2008 или 1999, я бы хотел, чтобы все годы были 2009, так как это то, что график года.

И то, что должно быть введено в код, чтобы получить данные, чтобы отобразить в том порядке, в котором они были, в исходном файле Excel.

Я говорю это потому, что большинство, если не все выступления Flypast, не показывают дату. Поэтому, когда места показаны в алфавитном порядке, становится труднее узнать, был ли Flypast связан с соответствующим дисплеем, то есть когда самолет проходил к дисплею и т. д. Если данные находятся в исходном, не алфавитном порядке для мест проведения, ТО соответствующие Flypasts должны быть внизу, я думаю, хотя, возможно, я ошибаюсь.

В выходных данных, когда я запускаю код Python, у меня теперь есть дополнительный столбец, называемый Dakota и Fighters в том же слоте дисплея. Из-за способа сортировки данных в исходном файле .xls. Здесь показаны только те места, где самолеты находятся в одном слоте дисплея, я думаю, потому что, когда DAK и HS становятся DHS, как вы поймете из кода, и можете видеть в исходном документе .XLS, когда эти значения в столбце Duration, т. е. Durn, не совпадают, т. е. 0:05 и 0:10, т. е. 5 и 10 минут, они не отображаются на выходе.

Только тогда, когда оба значения одинаковы, они показывают. то есть, когда DHS все находятся в одном слоте дисплея, хотя по какой-то причине для места проведения Вудсток, где оба значения равны 0:15, строка не отображается, какие-либо идеи, почему это так ?
Вудсток-Роу тоже раньше не показывали, не могу понять почему.

Таким образом, все эти строки отображаются, но в столбце "В одном слоте дисплея" я хотел бы, чтобы все строки места проведения, где они находятся в одном слоте дисплея, говорили "Да", а те, которые не находятся в одном слоте дисплея, говорили "нет".

Кроме того, я заметил, что в столбце Дата он говорит, что нет даты в выводе фрейма данных. Это происходит, когда дата отсутствует в столбце "дата", в строках данных в файле .xls. то есть макет данных в файле .xls является проблемой. У меня есть все YES bar The Venue 'WOODSTOCK', показанные в Dakota и Fighters в одном и том же столбце слота дисплея, а теперь будут показаны все строки "нет".

Here is a Link to a Picture, of a sample of the .xls File Data. Is there a way, to have the Date populate, the empty Columns in the Rows with Data in, up to the right point in the Dataframe ?

Here is the link, to a Picture of what I mean :-

https://www.flickr.com/photos/153177973@N08/49330715541/in/dateposted-public/

Kembles's DHS appearance on the 20th June, won't show a date in the DataFrame, as that Data is missing from that Row. The Date is higher up, but they have not included the Date for every Row, even though the relevant Data for the Date, is lower down. How could this be done for all Rows, giving the Correct Date

Вот текущий код Python, который я запускаю в Jupyter Notebook :-

<pre>import pandas as pd
        
xls = pd.ExcelFile(r'C:\Users\Edward\Desktop\BBMF Schedules And Master Forum Thread Texts\BBMF Display Schedule 2009.xls')   
data = pd.read_excel(xls, sheet_name="Sheet1")      
pd.options.display.max_rows = 1000   
pd.options.display.max_columns = 1000
df = pd.DataFrame(data, columns= ['Venue','A/C','DISPLAY/','Date','BID','Durn'])
#df[(df['Venue'].str.contains('[a-zA-Z]') & (df['DISPLAY/'].str.contains('DISPLAY') & df['A/C'].str.contains("DHS|DAK|HS|SPIT")) & (df['A/C'] != 'LHS') & (df['A/C'] != 'LANC'))] 
df["Date"].fillna("No Date", inplace = True)   
df['A/C'].unique().tolist()  
rename_map = {
    'DAK': 'D',
    'SPIT': 'S',
    'LANC': 'L',
    'HURRI': 'H',
    'PARA': 'P'
}
df['A/C std'] = df['A/C'].replace(rename_map)
print(df['A/C std'].unique().tolist())
print("=======")  
selected = df.loc[df['DISPLAY/'] == 'DISPLAY']
#selected = df.loc[df['DISPLAY/'] == 'FLYPAST']
#selected = df.loc[df['DISPLAY/'].isin(['DISPLAY', 'FLYPAST'])]
#selected = df.loc[df['A/C'].isin(['DS', 'DH', 'DHS', 'SD', 'HSD'])]
groupby_venue_date = selected.groupby(['Venue', 'BID', 'Date', 'DISPLAY/', 'Durn']) 
aircraft = groupby_venue_date['A/C std'].apply(''.join).rename('Aircraft-combined')
def sorted_string(s):
    return ''.join(sorted(s))   
def remove_duplicate_chars(s):
    return ''.join(set(s))
   
   
#####################
#####################
#####################
#####################
   
   
df=pd.DataFrame(aircraft)
#print(df) #original df
     
    
indexNames = df[~df['Aircraft-combined'].str.contains('D',na=False)].index
df.drop(indexNames , inplace=True)
#print(df)#prints all rows having D and removes remaining rows
   
df['Aircraft-combined']=df['Aircraft-combined'].replace(to_replace='SD', value='DS')
df['Aircraft-combined']=df['Aircraft-combined'].replace(to_replace=['HSD','HDS', 'SHSD'], value='DHS')
#print(df)#replaces the SD with DS and HSD,HDS and SHSD with DHS
     
  
    
df = df.drop(df[df['Aircraft-combined'] == 'D'].index)#remove value that match letter D
df = df.drop(df[df['Aircraft-combined'] == 'DD'].index)
df = df.drop(df[df['Aircraft-combined'] == 'DL'].index)
df = df.drop(df[df['Aircraft-combined'] == 'LD'].index)
df = df.drop(df[df['Aircraft-combined'] == 'LDS'].index)
df = df.drop(df[df['Aircraft-combined'] == 'LSSD'].index)
#df = df.drop(df[df['Aircraft-combined'] != 'D'].index)#if need the rows that match only letter D in selected dataframe column
  
  
  
#column names before alignment
#print("column names: before change  ", list(df.columns.values.tolist()))
#print("=======")
#print(df)
#print("=======")  
   
  
#to fix column name alignment 
df.to_csv(r'C:\Users\Edward\Desktop\BBMF Schedules And Master Forum Thread Texts\tempfile.csv')
df = pd.read_csv(r'C:\Users\Edward\Desktop\BBMF Schedules And Master Forum Thread Texts\tempfile.csv',names=['Venue','BID','Date','DISPLAY/','Durn','Aircraft-combined'], header=0 )
  
  
#column names before alignment
#print("column names:  after change ",list(df.columns.values.tolist()))
#print("=======")
#print(df)
#print("=======")
  
#convert df['Durn'] column to datetime foramt
df['Durn']= pd.to_datetime(df['Durn'],format='%H:%M:%S').apply(pd.Timestamp)
#print("changing datatype of column Durn----->",df['Durn'].dtype)
#print("=======")
#compare minutes with extracting minutes from datetime64 column 
comparelist=[5,10,15,20]
df['Dakota And Fighters In The Same Display Slot'] = ((df['DISPLAY/'] == 'DISPLAY') & (df['Durn'].dt.minute.isin(comparelist))).map({True:'YES', False:'NO'})
#print(df)
#print("applied... the condition to compare minutes for Durn column")
#print("=======")
  
  
#return df['Durn'] column datetime64 format to object type
df['Durn'] = pd.to_datetime(df['Durn'], format='%H:%M:%S').dt.time
#print("reverted datatype of column Durn back to ----->",df['Durn'].dtype)
#print("=======")
  
#print("\n\n*** FINAL RESULTSET ***\n\n")
  
pd.DataFrame(df)
 
#print(df)    #final resultset
#print("======="

А вот и ссылка на Excel .XLS-файл, о котором идет речь :-

http://web.archive.org/web/20090804234934/http://www.raf.mod.uk/bbmf/rafcms/mediafiles/F0ED6EA8_1143_EC82_2E4534A1036AA506.xls

Любая помощь будет оценена по достоинству

С уважением

Эдди Лебедки

Что я уже пробовал:

Обновление Кода, С Вопросом :-

Я добавил в свой код следующее :-

df["Date"].fillna(method='ffill', inplace = True)

На месте из :-

df["Date"].fillna("No Date", inplace = True)

Так что "нет дат", показанных в столбце "дата" для строк, теперь были заполнены правильной датой, за исключением части года, то есть 2008 года, который должен сказать 2009 год, я не уверен, как это исправить ?

В следующей части моего кода :-

<pre>#convert df['Durn'] column to datetime format
df['Durn']= pd.to_datetime(df['Durn'],format='%H:%M:%S').apply(pd.Timestamp)
#print("changing datatype of column Durn----->",df['Durn'].dtype)
#print("=======")

#compare minutes with extracting minutes from datetime64 column 
comparelist=[5,10,15,20,]
df['Dakota And Fighters In The Same Display Slot'] = ((df['DISPLAY/'] == 'DISPLAY') & (df['Durn'].dt.minute.isin(comparelist))).map({True:'YES', False:'NO'})

#print(df)
#print("applied... the condition to compare minutes for Durn column")
#print("=======")
 
#return df['Durn'] column datetime64 format to object type
df['Durn'] = pd.to_datetime(df['Durn'], format='%H:%M:%S').dt.time
#print("reverted datatype of column Durn back to ----->",df['Durn'].dtype)
#print("=======")

Что мне нужно будет изменить, чтобы строки, не отображающиеся из-за несоответствующих значений в столбце "Дурн", действительно отображались и не отображались в столбце "Дакота и бойцы в одном слоте дисплея" для этих строк ? Для совпадающих значений в comparelist=[5,10,15,20,] если они совпадают, то занимают обе строки, одно и то же значение, так что 5+5 = 10, 10+10 = 20, 15+15 = 30, 20+20 = 40.

Тогда как для тех, которые не совпадают, то есть 5 в одном ряду и 10 в другом, 5+10 = 15. Как бы я написал код, чтобы достичь того, к чему я стремлюсь ? Любая помощь будет оценена по достоинству

Обновление 2 :-

Я добавил следующие две строки в свой код :-

df['Date']= pd.to_datetime(df['Date'],format='%Y-%m-%d')
df['Date']= pd.to_datetime(df['Date']).dt.strftime('%d-%m-%Y')

Eddie Winch

Привет, Зурдодев, Большое Спасибо, что указал мне на это, я должен был работать
это я сам выяснил.

С уважением

Эдди

Мне нужна помощь в завершении моего кода Python

Richard MacCutchan

Eddie Winch

Richard MacCutchan

Eddie Winch

Richard MacCutchan

Eddie Winch

Eddie Winch

Richard MacCutchan

Eddie Winch

Richard MacCutchan

Eddie Winch

Richard MacCutchan

Eddie Winch

ZurdoDev

Eddie Winch

0 Ответов

Категории

Недавние ответы

Изменение источника данных (базы данных) программно

Проблема при попытке вставить данные: ошибка при преобразовании типа данных nvarchar в числовой.

Может ли кто-нибудь, пожалуйста, сказать мне, как я практичен в жизненном цикле страницы .NET

C# get и set ? любая помощь ценится!

Как получить список ip-адресов пользователей, подключенных к моему Wi-Fi