在R中使用表情符号 [英] Working with emoji in R

查看:0
本文介绍了在R中使用表情符号的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我有一个CSV文件,其中包含很多表情符号:

Person, Message,
A, 😉,
A, How are you?,
B, 🙍 Alright!,
A, 💃💃

我如何read.csv()进入R以使表情符号不会变成黑色?%s

(我要跟踪表情符号随时间变化的使用情况👽)

推荐答案

我的控制台有一种接受这些"字符"的字体:

  txt <- "Person, Message,
 A, 😉,
 A, How are you?,
 B, 🙍 Alright!,
 A, 💃💃"

 Encoding(txt)
#[1] "UTF-8"
 dput(txt)
#"Person, Message,
A, U0001f609,
A, How are you?,
B, U0001f64d Alright!,
A, U0001f483U0001f483"

> tvec <- scan(text=txt, what="")
Read 13 items
> dput(tvec)
c("Person,", "Message,", "A,", "U0001f609,", "A,", "How", "are", 
"you?,", "B,", "U0001f64d", "Alright!,", "A,", "U0001f483U0001f483"
)

> which(tvec == 'U0001f609,')
[1] 4

当我使用Scan使用逗号SEP读取文本时,前导空格阻止相等性测试成功,但如果我使用两个字符的版本,则测试成功:

> which(tvec == 'U0001f609')
integer(0)
> dput(tvec)
c("Person", " Message", "", "A", " U0001f609", "", "A", " How are you?", 
"", "B", " U0001f64d Alright!", "", "A", " U0001f483U0001f483"
)
> which(tvec == " 😉")
[1] 5

这是在Mac上使用Courier New作为控制台/编辑器字体。要查看有关Unicode表示形式的说明,请参阅?Quotes{base}。

这篇关于在R中使用表情符号的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆