全唐诗语料库是json的格式,如何用Python将语料库中的简体字和繁体字分割成两个不同的json文件或TXT文件 5

json文件的格式如下,每首诗都在一行内... json文件的格式如下,每首诗都在一行内 展开
 我来答
哈哈呵呵你好7
2019-04-09 · TA获得超过1626个赞
知道大有可为答主
回答量:2238
采纳率:79%
帮助的人:252万
展开全部

你好,python3的话,我们可以通过 try: 编码为 big5hkscs,不异常就说明是 繁体字。下面是一个例子代码:

    line = '我们今天去吃饭了' 
    l = '我们今天去吃饭了' 
    try: 
        print(line.encode('big5hkscs')) 
    except: 
        print ("New style ")
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式