文章目录 一、删除重复值 二、替换 三、离散化和分箱 一、删除重复值 对于下面的dataframe,有重复的行: df = pd.DataFrame() df['a'] = [1, 2, 2, 3] df['b'] = [2, 3, 3, 4] df 输出结果: a b 0 1 2 1 2 3 2 2 3 3 3 4 DataFrame的duplicated方法返回的是一个布尔值Series,这个Series反映的是每一行是否存在重复(与之前出现过的行相同)情况: df