将有道词典的单词本导入到欧路词典中

本文写作于 2019年2月17日 距离今天已有  
  天,请注意文章时效性

有道词典停止了iPad HD版本的维护,只能使用放大版的手机版,本人对此非常不满,于是又在群友的推荐下,选择了欧路词典

但是最大的问题是如何转移单词本,毕竟是竞争产品,直接转移是不可能的,只能通过“导出”“导入”的方式转移,但是操作起来又不是很简单,这里就记一下具体的过程

  1. 首先要用电脑版的有道词典导出单词本,本人主要使用 macOS ,但是 macOS 版的有道词典没有导出功能,所以我选择使用 Windows 版本(作为备用系统追求稳定使用的是老旧的 Windows 7,请勿介意)的有道词典。

  2. 在这个位置,就可以找到导出选项

  3. 由于欧路词典仅支持导入xml格式的文件,并且名字必须是StudyList,所以我们这里选择xml格式,名字改为StudyList

  4. 为了对比文件内容,还需要导出欧路词典的单词本(如果是第一次用请先查一个单词并加入单词本中)。导入方法就是在app中点 工具-软件设置-头像-导入导出生词本-导出生词本,iOS的话就可以在 iTunes 中获取这个文件

  5. 之后我使用 Visual Studio Code 打开该文件,这里使用什么编辑器无所谓,只要后面的替换你能查到你所有的编辑器的正则表达式就可以。如果是新手那就下一个 Visual Studio Code 好了

  6. 打开两个xml文件,接下来进行对比。对比后发现,欧路词典的文件中,单词保存在CustomizeListItem 这个标签中,并且不像有道,保存了注释、音标等内容。不过欧路词典中还包括保存时间等变量,经过测试,即使后面所有变量都一样也不影响导入,比如所有单词后面都是

    itemType="-9999" addTimeP="20180730T013426" rating="1" categoryTag="@0" fakeRecordId="-1" fakeLibId="0" searchCount="0" deleted="0" serverTimestamp="20180730T015428" localTimestamp="19700101T000000" str1="" meta=""
    

    是没问题的。

  7. 那么思路有了,对于有道词典导出的文件,除了第一项,只要把

    </item><item>    <word>
    

    替换成

    <CustomizeListItem word="
    

    再将

    </word>
    <trans><![CDATA[adj. 产前的;胎儿期的; 出生以前的]]></trans>
    <phonetic><![CDATA[[priː'neɪt(ə)l]]]></phonetic>
    <tags></tags>
    <progress>-1</progress>
    

    替换为

    " itemType="-9999" addTimeP="20180730T013426" rating="1" categoryTag="@0" fakeRecordId="-1" fakeLibId="0" searchCount="0" deleted="0" serverTimestamp="20180730T015428" localTimestamp="19700101T000000" str1="" meta="" />
    

    即可,其中的注释虽然不尽相同,但是可以用正则表达式替换。

  8. 我们可以轻松的使用替换功能(Ctrl+F)将

    </item><item>    <word>
    

    替换成

    <CustomizeListItem word="
    
  9. 对于后面,在 https://msdn.microsoft.com/zh-cn/library/2k3te2cs.aspx 查阅正则表达式的用法后,准备用

    /word>.*</progress>
    

    替换成

    itemType="-9999" addTimeP="20180730T013426" rating="1" categoryTag="@0" fakeRecordId="-1" fakeLibId="0" searchCount="0" deleted="0" serverTimestamp="20180730T015428" localTimestamp="19700101T000000" str1="" meta="" />
    

    发现该方法对于原文有多行则无法查找到。之后我试了很多方法,包括替换换行等,都无效。

  10. 于是我使用了一种传统方法,使用Word替换。

  11. 将所有内容复制到Word中,打开“查找和替换”,将

    \\</word\\>*\\</progress\\>(注意这里的尖括号一定要加转义字符)
    

    替换为

    abcd
    

    这里你不能替换为上述的那一长串

  12. 之后再把这些复制回 Visual Studio Code 覆盖,把

    abcd
    

    替换为

    " itemType="-9999" addTimeP="20180730T013426" rating="1" categoryTag="@0" fakeRecordId="-1" fakeLibId="0" searchCount="0" deleted="0" serverTimestamp="20180730T015428" localTimestamp="19700101T000000" str1="" meta="" />13.
    

    修改一下第一项的格式,删除结尾的

    </item></wordbook>
    

    然后复制到欧路词典导出文件的里面即可

本文同步发布于:
Bilibili 专栏:https://www.bilibili.com/read/cv2779077
Medium:https://medium.com/@muchenran2/将有道词典的单词本导入到欧路词典中-82580138ea42
如果需要,可以通过上述平台进行评论