Day04 - Pandas #5

maximechoulika · 2019-08-07T15:43:18Z

Scope has to be defined

ErenO · 2019-08-21T09:52:10Z

J'avais fait un cours en ligne sur Coursera l'an dernier la première semaine était sur les bases de pandas, il y a aussi quelques liens intéressants :

mybenzar · 2019-08-21T13:06:45Z

Super, merci !

On Wed, Aug 21, 2019 at 11:52 AM Eren Ozdek ***@***.***> wrote: J'avais fait un cours en ligne sur Coursera l'an dernier la première semaine était sur les bases de pandas, il y a aussi quelques liens intéressants : - https://github.com/legolas140/competitive-data-science-1/blob/master/assignment1/PandasBasics.ipynb - https://www.machinelearningplus.com/python/101-pandas-exercises-python/ - https://pynative.com/python-pandas-exercise/ - https://www.w3resource.com/python-exercises/pandas/index.php - https://www.pythonprogramming.in/pandas-examples.html — You are receiving this because you were assigned. Reply to this email directly, view it on GitHub <#5>, or mute the thread <https://github.com/notifications/unsubscribe-auth/AKWS4VVKX3Y6F2QAUOXJ6ULQFUF4XANCNFSM4IKBZS6A> .

-- Myriam Benzarti

Fulguritude · 2019-10-18T10:45:09Z

ex02: on fait du error handling ?

Fulguritude · 2019-10-18T11:35:17Z

ex02: le résultat fourni (0.02307969707897584) correspond à

	part_df = df[df['Year'] == year]
	part_df = part_df[part_df['Sex'] == gender]
	part_sport_df = part_df[part_df['Sport'] == sport]
	return part_sport_df.shape[0] / part_df.shape[0]

mais cela ne prend pas en compte les doublons éventuels (comme nous avertit pourtant l'énoncé); pour cela il faut ajouter les lignes

	part_df.drop_duplicates(['Name'], inplace = True)
	part_sport_df.drop_duplicates(['Name'], inplace = True)

juste avant le return, dans quel cas, le résultat est 0.01935634328358209

maximechoulika · 2019-10-18T13:18:56Z

Je note ça on updatera :)

Fulguritude · 2019-10-18T13:33:49Z

ex04: the examples are a bit misleading: sp.where(2162) is of course not in the dataset (although I personally appreciate the reference given that I'm currently reading the original manga), and the sp.when('Atlanta') olympic games took place in 1996, neither in 1903 nor 2042 (of course)
I think it should be mentioned not to trust the examples

Fulguritude · 2019-10-18T13:40:48Z

J'ai trouvé ex04 bcp plus simple que ex03

Fulguritude · 2019-10-18T14:13:53Z

ex05: Si on compte les médailles en double pour les épreuves en équipe, l'ex05 ne change quasiment rien à l'exercice 3. S'il faut compter les médailles en ne comptant pas en double les médailles pour une même épreuve, il y a des complexités de dédoublonnage qui méritent un exemple juste plutôt qu'un exemple factice. Dans tous les cas, il faut rajouter ces considérations à l'énoncé IMO

Sans dédoublonnage: France 2008: {'G': 25, 'S': 24, 'B': 28}
Avec dédoublonnage juste, ce que j'essaye de faire maintenant, mais avec des problèmes, {'G': 7, 'S': 16, 'B': 20} https://en.wikipedia.org/wiki/France_at_the_2008_Summer_Olympics

À noter que le csv n'est pas à jour, Yannick Szczepaniak et Manuela Montebrun ont reçu leurs médailles plusieurs années plus tard pour cause de disqualification de leurs compétiteurs, leur médaille est donc NA pour le csv et le parsing correct du csv renvoie donc 2008: {'G': 7, 'S': 16, 'B': 18} après dédoublonnage approprié

(Ca m'énervait de ne pas comprendre pourquoi j'avais pas juste xd)

Fulguritude · 2019-10-18T14:42:33Z

ex06 et ex07: manque d'exemples concrets, le terme feature m'a perdu au départ, si c'est juste les colonnes ça peut mériter une commande et un screen de mathplotlin.pyplot.hist() etc

maximechoulika added the Phase 1 label Aug 7, 2019

maximechoulika changed the title ~~Day04~~ Day04 - Pandas Aug 7, 2019

mybenzar self-assigned this Aug 7, 2019

maximechoulika added the fixme label Oct 18, 2019

matboivin mentioned this issue Oct 19, 2019

Day04 - Updates post-testing #32

Closed

9 tasks

maximechoulika closed this as completed Oct 19, 2019

sirius911 mentioned this issue Sep 17, 2022

Python-Module-02 #251

Open

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Day04 - Pandas #5

Day04 - Pandas #5

maximechoulika commented Aug 7, 2019 •

edited

Loading

ErenO commented Aug 21, 2019

mybenzar commented Aug 21, 2019 via email

Fulguritude commented Oct 18, 2019

Fulguritude commented Oct 18, 2019 •

edited

Loading

maximechoulika commented Oct 18, 2019

Fulguritude commented Oct 18, 2019 •

edited

Loading

Fulguritude commented Oct 18, 2019

Fulguritude commented Oct 18, 2019 •

edited

Loading

Fulguritude commented Oct 18, 2019

Day04 - Pandas #5

Day04 - Pandas #5

Comments

maximechoulika commented Aug 7, 2019 • edited Loading

ErenO commented Aug 21, 2019

mybenzar commented Aug 21, 2019 via email

Fulguritude commented Oct 18, 2019

Fulguritude commented Oct 18, 2019 • edited Loading

maximechoulika commented Oct 18, 2019

Fulguritude commented Oct 18, 2019 • edited Loading

Fulguritude commented Oct 18, 2019

Fulguritude commented Oct 18, 2019 • edited Loading

Fulguritude commented Oct 18, 2019

maximechoulika commented Aug 7, 2019 •

edited

Loading

Fulguritude commented Oct 18, 2019 •

edited

Loading

Fulguritude commented Oct 18, 2019 •

edited

Loading

Fulguritude commented Oct 18, 2019 •

edited

Loading