exemple when()
La clause when() vous permet de modifier conditionnellement un cadre de données en fonction de son contenu. Vous devrez modifier notre DataFrame voter_df pour ajouter un nombre aléatoire à tout membre votant défini comme "membre du conseil".
Le DataFrame voter_df est défini et mis à votre disposition. La bibliothèque pyspark.sql.functions est disponible sous la forme de F.. Vous pouvez utiliser F.rand() pour générer une valeur aléatoire.
Cet exercice fait partie du cours
Nettoyer des données avec PySpark
Instructions
- Ajoutez une colonne à
voter_dfnomméerandom_valavec les résultats de la méthodeF.rand()pour tout électeur ayant le titre de membre du conseil. - Affichez quelques lignes du DataFrame, en notant si la clause
.when()a fonctionné.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Add a column to voter_df for any voter with the title **Councilmember**
voter_df = voter_df.____('random_val',
____(____, ____))
# Show some of the DataFrame rows, noting whether the when clause worked
voter_df.____