Набор данных очистки [closed]

У меня есть фрейм данных из результата поиска в Интернете.

    dates      Home_Team       Away_Team          HomeScore  AwayScore    home_odds    draw_odds    away_odds
--  ---------  --------------  ---------------  -----------  -----------  -----------  -----------  -----------
 0  20-Mar-16  Southampton     Liverpool                  3  2            -            -            -
 1  29-Aug-15  Aston Villa     Sunderland                 2  2            -            -            -
 2  24-Jan-16  Arsenal         Chelsea                    0  1            -            -            -
 3  13-May-07  Bolton          Aston Villa                2  2            1.99         3.24         3.52
 4  13-May-07  Chelsea         Everton                    1  -            1.6          None         5.42
 5  13-May-07  Manchester Utd  West Ham                   p  1            1.66         3.3          5.1
 6  13-May-07  Middlesbrough   Fulham                     3  1            1.82         3.29         4.11
 7  13-May-07  Portsmouth      Arsenal                    0  0            2.7          3.25         2.36
 8  13-May-07  Sheffield Utd   Wigan                      1  2            2.2          3.3          2.85
 9  13-May-07  Tottenham       Manchester City            2  1            1.46         3.75         7
10  13-May-07  Watford         Newcastle                  1  1            2.55         3.2          2.59
11  17-Jan-21  Aston Villa     Everton                  nan  None         3.91         4.04         1.93

df.dtypes:
dates         object
Home_Team     object
Away_Team     object
HomeScore    float64
AwayScore     object
home_odds     object
draw_odds     object
away_odds     object

Ожидаемый и очищенный набор данных:

 dates                Home_Team       Away_Team          HomeScore    AwayScore    home_odds    draw_odds    away_odds
--  -------------------  --------------  ---------------  -----------  -----------  -----------  -----------  -----------
 0  2016-03-20 00:00:00  Southampton     Liverpool                  3            2       nan          nan          nan
 1  2015-08-29 00:00:00  Aston Villa     Sunderland                 2            2       nan          nan          nan
 2  2016-01-24 00:00:00  Arsenal         Chelsea                    0            1       nan          nan          nan
 3  2007-05-13 00:00:00  Bolton          Aston Villa                2            2         1.99         3.24         3.52
 4  2007-05-13 00:00:00  Chelsea         Everton                    1          nan         1.6        nan            5.42
 5  2007-05-13 00:00:00  Manchester Utd  West Ham                   nan          1         1.66         3.3          5.1
 6  2007-05-13 00:00:00  Middlesbrough   Fulham                     3            1         1.82         3.29         4.11
 7  2007-05-13 00:00:00  Portsmouth      Arsenal                    0            0         2.7          3.25         2.36
 8  2007-05-13 00:00:00  Sheffield Utd   Wigan                      1            2         2.2          3.3          2.85
 9  2007-05-13 00:00:00  Tottenham       Manchester City            2            1         1.46         3.75         7
10  2007-05-13 00:00:00  Watford         Newcastle                  1            1         2.55         3.2          2.59
11  2021-01-17 00:00:00  Aston Villa     Everton                  nan          nan         3.91         4.04         1.93

df.dtypes:

dates        datetime64[ns]
Home_Team               str
Away_Team               str
HomeScore               int
AwayScore               int
home_odds           float64
draw_odds           float64
away_odds           float64

Как лучше всего очистить этот набор данных?

Цель состоит в том, чтобы принудительно преобразовать все значения, отличные от int, в nan для столбцов int, столбцы объекта в строку и datetime

Есть ли какая-нибудь библиотека, которую я могу вызвать, чтобы почистить ее?

0

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *