从R中的数据框列中删除重音符号 [英] Remove accents from a dataframe column in R
本文介绍了从R中的数据框列中删除重音符号的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我有一个data.table库。
我在此data.table中得到了一个term列。
I got a data.table base. I got a term column in this data.table
class(base$term)
[1] character
length(base$term)
[1] 27486
I能够删除字符串中的重音符号。
我可以从字符串向量中删除重音符号。
I'm able to remove accents from a string. I'm able to remove accents from a vector of string.
iconv("Millésime",to="ASCII//TRANSLIT")
[1] "Millesime"
iconv(c("Millésime","boulangère"),to="ASCII//TRANSLIT")
[1] "Millesime" "boulangere"
但是由于某些原因,当我应用完全相同的功能时它不起作用在我的任期列上
But for some reason, it does not work when I apply the very same function on my term column
base$terme[2]
[1] "Millésime"
iconv(base$terme[2],to="ASCII//TRANSLIT")
[1] "MillACsime"
有人知道这里发生了什么吗?
Does anybody know what is going on here?
推荐答案
好的解决方法:
Encoding(base$terme[2])
[1] "UTF-8"
iconv(base$terme[2],from="UTF-8",to="ASCII//TRANSLIT")
[1] "Millesime"
感谢@nicola
这篇关于从R中的数据框列中删除重音符号的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文