對R中用符號隔開的資料進行統計?

時間 2021-11-01 13:32:21

1樓:孫利軍

library

(dplyr

)library

(magrittr

)# 假設資料存放在data.txt中,格式如下# 1 熟食:1|休閒食品:

1|冷凍冷藏:1|蔬菜:1|鮮肉:

1# 2 熟食:1|飲料:1|DIY課:

1|麵包:1|日化:1|冷凍冷藏:

1# 3 蔬菜:1|鮮肉:1|糧油:1|凍品:1# 4 休閒用品:1|南北罐頭:1|日化:1|學習、文化用品:1data

<-readLines

('data.txt'

)%>%

strsplit

(' |\\|'

)%>%

# 這一步實際上是對字串進行分割,分隔符是空格或者「|」

(function(x

))%>%

do.call

(rbind,.)

%>%# 按行合併

as.data.frame

(stringsAsFactors

=FALSE

)%>%

# 轉換成資料框,後面按組彙總方便點

set_colnames(c

('item'

,'n'

))# 分組彙總

data

%>%mutate(n

=as.integer(n

))%>%

group_by

(item

)%>%

summarise(n

=sum(n

))# A tibble: 14 × 2

item n

lt;chr>

# 1DIY課 1

# 2凍品 1

# 3 冷凍冷藏 2# 4糧油 1

# 5麵包 1

# 6 南北罐頭 1# 7日化 2

# 8蔬菜 2

# 9熟食 2

# 10鮮肉 2

# 11 休閒食品 1# 12 休閒用品 1# 13 學習、文化用品 1

# 14飲料 1

關於知乎對標點符號的要求,用途何在?

這事很簡單啊,首先在中文中使用英文標點是不標準的,問題作為公共區域更應該規範.其次就算使用英文標點,在半形標點前後插入適當的空格也應該是乙個常識吧.西文標點後都要加至少乙個半角空格的,記得十幾年前還流行加兩個,不光是逗號。這應該是認識了 26 個字母後就教的東西,我也不知道為什麼中國的英語老師都不提...

對四元數的定義的解釋?

啊哈 將1,i,j,k理解為四維空間的標準正交基更合適,例如可以把它們另起名字,分別叫做w,x,y,z四個座標軸的單位向量e0,e1,e2,e3。它們是正交的。如果i,j,k相等那麼ijk i i i i i 1.1 i j k既然相互正交,怎麼可能相等呢?所以i,j,k都是複數 二元數 嗎?1,i...

線性空間中的數域K,為什麼只能是實數域R或是複數域C, 其他域不行嗎

knowone 當然可以是別的域.一般來說有兩個坑,乙個是特徵是不是0,乙個是是不是代數閉.實數域上面還可以玩不等式,所以實數和複數上面可以搞出更多的花樣來.正常的線性代數書上應該會把一般的域上成立的性質和特徵0 代數閉 實數 複數域的特殊性質分開來的. 郭子恆 常規的線性空間純粹定義只要是個域就行...