摘要:现在将几万条数据从日语翻译成中文。因为数据的获取和处理用的是python代码,所以想先尝试翻译部分也用python实现。网上查到的翻译方法有百度、有道以及谷歌翻译(个人)下面会对这三个方法进行简单的测试和分析。模块导入手动安装,命令pip ...
现在将几万条数据从日语翻译成中文。
因为数据的获取和处理用的是python代码,所以想先尝试翻译部分也用python实现。
网上查到的翻译方法有百度、有道以及谷歌翻译(个人)
下面会对这三个方法进行简单的测试和分析。
模块导入
手动安装,命令pip install module_name
百度
text--待翻文本,f--初始语言,t--目标语言,后面方法类似
有道
谷歌
测试代码
测试过程:
翻译5个字串为一个小的单位输出消耗时间;
循环10次为一个大的单位输出消耗时间;
对不同的语言字串和循环次数做过多次测试,发现情况基本类似,所以这里选择了10次。
text_list = ["こんにちは", "こんばんは", "おはようございます", "お休(やす)みなさい", "お元気(げんき)ですか"]
time_baidu = 0
time_youdao = 0
time_google = 0
time_google2 = 0
for i in list(range(1, 11)):
time1 = time.time()
for text in text_list:
translateBaidu(text)
time2 = time.time()
print("百度翻译第%s次时间:%s" % (i, time2 - time1))
time_baidu += (time2 - time1)
time1 = time.time()
for text in text_list:
translateYoudao(text)
time2 = time.time()
print("有道翻译第%s次时间:%s" % (i, time2 - time1))
time_youdao += (time2 - time1)
time1 = time.time()
for text in text_list:
translateGoogle(text)
time2 = time.time()
print("谷歌翻译第%s次时间:%s" % (i, time2 - time1))
time_google += (time2 - time1)
time1 = time.time()
for text in text_list:
translateGoogle2(text)
time2 = time.time()
print("谷歌2翻译第%s次时间:%s" % (i, time2 - time1))
time_google2 += (time2 - time1)
print("百度翻译时间:%s" % (time_baidu / 10))
print("有道翻译时间:%s" % (time_youdao / 10))
print("谷歌翻译时间:%s" % (time_google / 10))
print("谷歌2翻译时间:%s" % (time_google2 / 10))
结果分析
日语字串原意为["你好", "晚上好", "早上好", "晚安", "您还好吧"]。
自己试试学习过程中遇到什么问题或者想获取学习资源的话,欢迎加入学习交流群
626062078,我们一起学Python!