Python pandas刪除指定行/列數(shù)據(jù)的方法實(shí)例
pandas是很常用的數(shù)據(jù)分析,數(shù)據(jù)處理的包。anaconda已經(jīng)有這個(gè)包了,純凈版python的可以自行pip安裝。
刪除重復(fù)值 drop_duplicates()
df=pd.DataFrame({'state':[1,1,2,2,1,2,2],'pop':['a','b','c','d','b','c','d']})
語法:drop_duplicates(subset,keep,inplace),其中參數(shù) keep:{‘first’,‘last’,F(xiàn)alse},默認(rèn)’first’
first:保留第一次出現(xiàn)的重復(fù)項(xiàng),刪除第二次及之后出現(xiàn)的重復(fù)項(xiàng)。
last:保留最后一次出現(xiàn)的重復(fù)項(xiàng),刪除之前出現(xiàn)的重復(fù)項(xiàng)。
"false":刪除所有重復(fù)項(xiàng)。
查看有nan的行,和不含有nan的行
#1 查看含有nan的行 df[df.isna().any(axis=1)]
#2 查看不含有nan的行 df[~df.isna().any(axis=1)] #有一個(gè)符號(hào) ~ 一定要注意這一點(diǎn)
示例:提取pandas dataframe中’商品名稱‘列包含’手機(jī)’字符的所有數(shù)據(jù):
#提取含有指定字符的行
df2=df[df['商品名稱'].str.contains(pat='手機(jī)',regex=False)] #regex=True則pat是一個(gè)正則表達(dá)式,regex=False表示pat是一個(gè)字符串
刪除pandas dataframe中’商品名稱’列包含’手機(jī)’字符的所有數(shù)據(jù):
#刪除含有指定字符的行
df2=df.drop(df[df['商品名稱'].str.contains(pat='手機(jī)',regex=False)].index,inplace=True) #regex=True則pat是一個(gè)正則表達(dá)式,regex=False表示pat是一個(gè)字符串
去掉某些具體值
數(shù)據(jù)集df中,對(duì)于屬性appPlatform(最后一列),我們想刪除掉取值為2的那些樣本。如何做?非常簡單。
df[(True-df['appPlatform'].isin([2]))]
當(dāng)然,有時(shí)候我們需要去掉不止一個(gè)值,這個(gè)時(shí)候只需要在isin([])的列表中添加。更具體來說,例如,對(duì)于appID這個(gè)屬性,我們想去掉appID=278和appID=382的樣本。
df[(True-df['appID'].isin([278,382]))]
另外,我們有時(shí)候并不只是考慮某一列,還需要考慮另外若干列的情況。例如,我們需要過濾掉appPlatform=2而且appID=278和appID=382的樣本呢?非常簡單。
df[(True-df['appID'].isin([278,382]))&(True-df['appPlatform'].isin([2]))]
很詳細(xì)的介紹鏈接:https://www.jb51.net/article/236118.htm#_lab2_0_4
官網(wǎng)詳細(xì)解釋鏈接:https://pandas.pydata.org/docs/reference/api/pandas.Series.str.contains.html?highlight=contains#pandas.Series.str.contains
小的示例
import pandas as pd
df = {'地址':['北京','上海','長沙','北京省會(huì)','廣州市區(qū)'],'table':['user','student','course','sc','book']}
df = pd.DataFrame(df)
print(df)
print('================')
citys = ['北京', '天津', '上海']
address = '|'.join(citys)
df_new = df[df['地址'].str.contains(address)] #包含對(duì)應(yīng)關(guān)鍵字
print(df_new)
- 相關(guān)閱讀
- Dreamweaver錯(cuò)誤:在onload運(yùn)行_beforeSave.htm時(shí),發(fā)生了一個(gè)JavaScript錯(cuò)誤
- 非常不錯(cuò)的支持各種瀏覽器的簡易調(diào)色板
- 利用ASP正則查找文章里面的圖片,然后在新窗口打開
- JavaScript實(shí)現(xiàn)把漢字轉(zhuǎn)換為拼音
- 360500怎么樣?啥時(shí)候能幫我的工資給我。
- asp文章內(nèi)容自定義分頁
- 一個(gè)javascript寫的RGB的調(diào)色器,非常不錯(cuò)
- 修改注冊(cè)表 優(yōu)化Win XP技巧20招
- 共有0條關(guān)于《Python pandas刪除指定行/列數(shù)據(jù)的方法實(shí)例》的評(píng)論
- 發(fā)表評(píng)論
呢 稱: | |
表 情: | |
內(nèi) 容: |
評(píng)論內(nèi)容:不能超過 1000 字,需審核,請(qǐng)自覺遵守互聯(lián)網(wǎng)相關(guān)政策法規(guī)。 |
驗(yàn)證碼: | |
您發(fā)布的評(píng)論即表示同意遵守以下條款:
一、不得利用本站危害國家安全、泄露國家秘密,不得侵犯國家、社會(huì)、集體和公民的合法權(quán)益;
二、不得發(fā)布國家法律、法規(guī)明令禁止的內(nèi)容;互相尊重,對(duì)自己在本站的言論和行為負(fù)責(zé);
三、本站對(duì)您所發(fā)布內(nèi)容擁有處置權(quán)。
- 更多>>同類信息
- Android移動(dòng)端自動(dòng)化測試:使用UIAutomatorViewer與Selenium定位元素
- python通過代碼修改pip下載源讓下載庫飛起
- python里面requests.post返回的res.text還有其它的嗎
- windows7環(huán)境下安裝配置jdk
- python對(duì)微信操作要用到這兩個(gè)庫wxpy與itchat
- 8種Python字符串拼接的方法,你知道幾種
- 更多>>最新添加文章
- dw里面查找替換使用正則刪除sqlserver里面的CONSTRAINT
- Android移動(dòng)端自動(dòng)化測試:使用UIAutomatorViewer與Selenium定位元素
- 抖音直播音掛載小雪花 懂車帝小程序
- javascript獲取瀏覽器指紋可以用來做投票
- 火狐Mozilla Firefox出現(xiàn):無法載入您的Firefox配置文件 它可能已經(jīng)丟失 或是無法訪問 問題解決集合處理辦法
- 在Android、iOS、Windows、MacOS中微信小程序的文件存放路徑
- python通過代碼修改pip下載源讓下載庫飛起
- python里面requests.post返回的res.text還有其它的嗎
- 更多>>隨機(jī)抽取信息
- 利用javascript讓PNG透明圖片支持支持(IE6、IE7、firefox下測試通過)
- python對(duì)微信操作要用到這兩個(gè)庫wxpy與itchat
- 談IE與Firefox的CSS兼容大全
- ASP.NET AJAX的應(yīng)用
- 設(shè)置個(gè)性的文字鏈接樣式,集齊網(wǎng)頁上常見的鏈接樣式
- 利用java使圖片左右上下循環(huán)連續(xù)滾動(dòng)不出現(xiàn)空白