如何使用正则表达式匹配包含emoji的URL? [英] How to match a URL containing emojis using a regex?

查看:0
本文介绍了如何使用正则表达式匹配包含emoji的URL?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

如何编写正则表达式以匹配包含emoji的URL?正则表达式应匹配普通字母数字URL以及在域名、路径和/或参数中包含表情符号的URL,例如:

🏹.to

http://www.🏹.to/🚀🌖

http://🏹.to/i❤️编码?REF=🏹

当今大多数Web应用程序(包括但不限于社交网络、在线社区等)自动检测用户以文本形式发布的URL,并将其转换为超链接。尽管如此,它们中几乎没有一个(包括StackOverflow)与包含上面报告的示例等表情符号的URL正确匹配,这些表情符号是有效的,100%有效,并且正在变得越来越受欢迎。 由于所有这些原因,当前的问题与使用任何编程语言实现更现代的URL匹配正则表达式的代码实现非常相关。

推荐答案

此正则表达式匹配普通字母数字URL以及域名、路径和/或参数中包含emoji的URL:

https?://(www.)?[-a-zA-Z0-9u1F60-uFFFF@:%._+~#=]{2,256}.[a-z]{2,256}([-a-zA-Z0-9u1F60-uFFFF@:%_+.~#?&//=]*)

在此处尝试:https://regexr.com/3gsl9

请注意,将来添加新的emoji时,可能需要更新包含emoji的Unicode字符范围(即uXXXX-uXXXX)。

这篇关于如何使用正则表达式匹配包含emoji的URL?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆