博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
去除文件中<feff>
阅读量:6985 次
发布时间:2019-06-27

本文共 940 字,大约阅读时间需要 3 分钟。

hot3.png

最近生成的文件中出现了<feff>乱码,而且单个文件中出现不止一次,在vim中打该文件显示<feff>,而在idea中则显示一个“-”,对数据处理造成了极大的困扰,通过使用其它编辑器打开发现,Windows记事本不出现乱码,notepad++不出现乱码,那么极有可能是该乱码位置写了一些不可见的标志字符。

在Windows下使用winhex打开该文件查看乱码位置的十六进制格式数据为EF BB BF,通过百度了解到是UTF8的bom信息

尝试过用notepad++转换格式去除bom信息,无果,我生成的文件本身编码就是utf8 without bom,那么只好通过shell来去除这个烦人的字符:

sed -i 's/\xEF\xBB\xBF//g' filename

不过这个命令偶尔失效,在我一开始用它就不管用的情况下,我试了以下命令

sed -i 's/
//g' filename

 成了!

不过命令2只成功了1次,之后再用命令1就完全o**k了。玄学问题。。。

命令详解:

        sed的命令格式: sed [-nefri] [动作]

             选项与参数:

                     -n:使用安静(silent)模式。在一般sed的动作中,所有来自stdin的数据一般都会被列出到终端上,但如果加上-n参数后,则只有经过sed特殊                           处理的那一行(或动作)才会被列出来。

                     -e:直接在命令行模式上进行sed的动作编辑

                     -f:直接将sed的动作写在一个文件内, -f  filename则可以运行filename内的sed动作

                     -r:sed的动作支持的是延伸型正则表达式语法(默认是基础正则表达式语法)

                     -i:直接修改读取的文件内容,而不是输出到终端

             function:

                     a:新增

                     c:取代

                     d:删除

                     i:插入

                     p:列印

                     s:取代   直接进行取代的工作,通常搭配正则表达式

       sed -i 就是直接对文本文件进行操作

                 

sed -i 's/原字符串/新字符串'  /home/1.md   #只替换一个sed -i 's/原字符串/新字符串/g' /home/1.md   #全部替换

参考资料:

转载于:https://my.oschina.net/u/2422458/blog/2986922

你可能感兴趣的文章
今年光伏市场规模可达30GW 分布式有望占据三分江山
查看>>
因新漏洞问题 Firefox 49发布时间将延期一周
查看>>
WLAN产品形态之分层架构
查看>>
Chrome 隐藏 SSL 证书信息 禁止禁用 DRM
查看>>
AngularJS 的自定义指令
查看>>
《CCNA ICND2(200-101)认证考试指南(第4版)》——第1章定义生成树协议
查看>>
什么样的 RPC 才是好用的 RPC
查看>>
《Adobe Premiere Pro CC经典教程》——14.6 特殊颜色效果
查看>>
Debian 项目不再提供 CD 格式的 ISO 镜像
查看>>
《设计团队协作权威指南》—第1章1.3节甘为螺丝钉
查看>>
android 屏幕保持唤醒 不锁屏 android.permission.WAKE_LOCK
查看>>
《Unity 3D 游戏开发技术详解与典型案例》——1.3节第一个Unity 3D程序
查看>>
Airbnb数据科学团队进化论:如何由内而外实现数据驱动
查看>>
如何用机器学习预测超售,避免美联航“暴力赶客”悲剧
查看>>
css细节(实习第1天)
查看>>
腾讯Android自动化测试实战3.1.4 Robotium的控件获取、操作及断言
查看>>
《C语言点滴》一1.5 内功修炼
查看>>
linux 怎么完全卸载mysql数据库
查看>>
Dart的HTTP请求和响应(1)
查看>>
寻找最大的K个数,Top K问题的堆实现
查看>>