我正在尝试标记一个文件中的所有拉丁字母组成,例如:
This is English. 这是中文。 This is more English.
这将被标记为:
\english{This is English.} 这是中文。 \english{This is more English.}
我尝试使用sed来标记这些单词:
sed 's/[A-Za-z0-9 ]*/\\english{&}/g' file
运行后,它基本上是正确的,但是,它也是在所有中文字符之间放置标记,例如:
\english{This is English.} 这\english{}是\english{
当我加载一个中文文档(并非所有的中文documents.My需求文档都不是编码格式)时,我得到了以下的例外情况,它看起来像正常/普通的中文document.As每一个机密关切,我没有提供我的要求document.Kindly,提供您的输入来支持所有的中文document.Kindly文档。
org.pdfclown.util.NotImplementedException: Encrypted files are currently not supported.
at org.pdfclown.files.File.<init>(File.java:147)
at