12点之前会更新一波,通过试错,写了一个新正则来提取文本。防止了匹配到一些阴间控制代码,同时我这次先对脚本进行了预处理,减少了大量之前会漏提的行。总而言之,这次写的新正则,应该会大大减少我的工作量。我先去做个术语表,上次的术语表,因为正则的缺陷,导致漏提了1000行左右的重要文本。这东西不仔细去看根本发现不了
12点之前会更新一波,通过试错,写了一个新正则来提取文本。防止了匹配到一些阴间控制代码,同时我这次先对脚本进行了预处理,减少了大量之前会漏提的行。总而言之,这次写的新正则,应该会大大减少我的工作量。我先去做个术语表,上次的术语表,因为正则的缺陷,导致漏提了1000行左右的重要文本。这东西不仔细去看根本发现不了