在如今这个时代,数据存储是比过去方便许多,但是可靠性却也降低更多。硬件坏了,我们可以买个新的。如果数据丢了,那真的是晴天霹雳。重要的数据是很宝贵的东西,如何才能时间保存重要的数据文件呢?
数据对我来讲是最宝贵的东西,无数血与泪的教训后,让我开始深入思考,怎么样才能让我的数据长期安全的保存几十年甚至终身?
想要长期保存数据,其实是一个成本问题,你愿意花多少钱和精力来做这件事情,决定预算以后,你不能依靠某一种单独的媒介来想着存进去就一劳永逸,而应该设计属于你自己的备份流程,靠流程来保证数据安全,比如下面几个点供你选择参考
第一:明确可靠性等级,即数据分级,核心数据,重要数据,普通数据,可丢失数据。不同层次的数据对可靠性的要求是不一样的,对应的方法也不一样
第二:格式转存,特别对于媒体数据,有损图片:JPG->BPG 基本能够清晰度不变但是尺寸变为原来 1/3,无损图片:PNG->FLIF,基本又能减少一半,如果你是 BMP/TGA 等老格式,直接转为 FLIF/BPG,马上让你空间缩小十倍。音视频数据也可以用更先进的编码器进行转存,这样你的空间占用至少能省一半出来。但是不要用一些太偏门的格式,避免几年后没有合适的程序读取
第三:使用好一点的介质,都是 DVD-R,便宜的有 1-2 元一张,贵的有 80-100 元一张,区别就是质量,硬盘也分监控盘,企业盘还是消费盘。如果手头不是那么紧张,尽量使用质量好点的介质来保存你的数据
第四:定期转存,不管放什么介质里,都需要定期检查,修复,活动介质可以靠一些自动脚本来转存,非活动介质需要手动进行
第五:重要数据至少存三分,热数据(工作集),备份,备份的备份
第六:备份方案根据数据重要度进行区分,哪些数据只需要 Raid 备份,哪些数据除了 Raid 外,还需要定时冷备到另外一块物理硬盘?哪些数据还需要定期刻录光碟
第七:尽量地理上多地冗余,即便家里地震了也可以从异地恢复出来
第八:尽量把文件直接放在文件系统上面,而不是再弄一个打包文件把一堆文件打了包再存,当介质发生故障时,打包文件很难恢复,而直接放在文件系统上的文件相对容易恢复一些。
不要:
1、不要使用“光盘”刻录来保存数据。
CD VCD DVD 等光盘都不可靠,如果硬要选择的话,要存储至少是蓝光光盘,有条件的话选择支持 M-DISC 技术的,但是价格不低。
对于数据储存来说,光碟是最廉价最受欢迎的介质,它们的寿命一般来说是 10-20 年。但是正常情况你不要指望你光盘上的东西五年后还能正常读出来。
因为,即便一些号称长期保存百年以上的光盘,寿命也会由于我们各种不当行为大大减少,比如,不小心刮花光盘,在盘面上留下指纹或者手上的油脂,这些都会促进光盘表面化学成分变质,最终导致你的数据损坏。
而且一旦光盘出问题,数据就可能再也找不回来了。
2、不要使用“U盘”来长期保存数据。
如今U盘确实够大够便宜,256GU盘也才100多块钱。
但U盘是有读写次数的,在频繁大量读写的情况下,一般能用到10年就不错了,所以不推荐用U盘来长期存储数据。
3、不要用“网盘”来保存数据。
数据备份首先排除所有网盘服务,无论是国内还是国外的。网盘这种东西从当年一开始出来的时候,无数人追捧,但结果他们存的资料,包括大量怀旧游戏资料,很多都泡汤了。
把重要数据放在网盘里,等于把自己家里的东西放在别人家里,他想扔掉就扔掉,想用掉就用掉。
上网费用并不便宜,网盘的增值服务费也很贵。(相比之下网盘费用其实比本地计算机硬盘贵的多,而且用户只有租赁权而没有所有权。)
网盘只适合做数据“分享”,不适合做数据保存,硬要保存的话,也只适合保存一些,临时的,非关键数据。比如电影这些,看完一遍丢了也就丢了,而关键数据想要长期保存的话,网盘是风险最大的地方。想想百度网盘。。。
要:
1、机械硬盘:对于家庭数据备份,最廉价和可靠性也不错的方法就是移动硬盘,必须是“机械硬盘”备份。
固态硬盘断电后数据容易丢失,使用寿命也远远不及机械硬盘。
a. 稳定性好,二十年前的硬盘数据至今还在。
b. 保存成本相对便宜。就目前行情而言,九个6TB硬盘就搞定,无需追求大容量硬盘。数据保存越分散安全性越高。即便其中一个硬盘坏还有八个硬盘是好的。还可以用各种手段恢复数据。
按100TB数据量来算(考虑冗余),贵的可以买30块4TB企业盘(4TB 3.5英寸企业级SATA盘约一千元/块,价格参考京东自营),便宜的可以买15台西数My Book 8TB(海淘,10TB型号性价比也很高,平均每TB一百二十元左右),拆出来全是5400rpm的氦气盘(不拆直接用也行,就是接线麻烦),花费15k到30k元(取决于硬盘型号)。
c. 使用简单,接在电脑上复制粘贴就行了,无需任何专业知识和技能,小白都可以操作。
2、长时间保存重要数据的唯一方法是备份。备份的定义是数据要至少保存两份。
但不是所有的数据都需如此。而对于消耗了自己最多的时间、精力与财力,以及以后不好再找到及下载到的的数据,在没有条件进行“三地备份”的情况下,对此也不妨采取如下等而下之却也比较实用的措施:
首先,对于这样的数据,在两块硬盘上各存一份一模一样的(同后)——然后妥善存放在住所里两个不同的地方。(换句话说,两份数据至少不放在同一主机里,或者不放在同一建筑物里,或者不放在同一个城市里。)
然后,在一块4TB的移动硬盘上再存一份,随身携带作为安全备份。
当然,如果有一台车子的话,那么6TB及以上的移动与台式机硬盘也是可以考虑的——主要是体积与重量使然,超过4TB的硬盘实在不便于随身携带。
3、数据储存时的处理方式:
这里的重点,在于如何适度压制及二次压制(以下简称为“压制”)它们,以节省存储空间。
首先来说,对于文件格式(及诸如视频文件的编码格式)的选择,应尽量选取非冷门的格式。同时最好选取开源的格式。
另外,以下建议可能不适应于诸如司法证据、科研及医疗资料,以及专门的商业素材等等不能够随意压制的材料。
同时,既然是在说“压制”,那么自然就是在“不考虑真爱”的情况下。并且,以下建议也是在没有考虑“完成它们所需的时间”的情况下给出的。
◇文本类
这里还不涉及“压制”,只是建议尽量用Unicode编码(尤其是UTF-8)来保存它们——不只是对于TXT文档。
另外,对于用UTFUTF-8编码的时文档需要不要为其加上“BOM”(Windows的记事本好像会自动为其附加上)这点,见过的多数网友对此基本持否定并有所反感的态度。而带上那个的话,对于文档的正常浏览及修改与保存有无影响,对此小编就一无所知了。
◇图像类
对于像是一般的照片那样色彩斑驳,本来就是由无数“噪点”构成的图像,尽量转换为JPG或其他有损格式。
对于其他没有大片纯色色块,以及自己不打算再继续编辑的图像,可以参考上一条。
◇音频类
可以转换为MP3、AAC,或者开源的OGG——相比之下,对于其码率的选择可以尽量高一些。
对于讲座、讲义、朗诵类音频,可以进一步转化为单音轨。
◇视频类
总体而言,这是“最有文章可作”的一大类了。
压制(封装)格式建议选择较为主流的FLV或MP4(MKV一会再说)。而视频的编码,建议采取同样较为主流的h.264/h.265或mpeg4等等
对于清晰度本就不高的老电影、老电视剧、老动漫等,在确保其字幕基本清晰的情况下,将其重新压制为低码率(略高于默认,同后)的480P乃至360P——不过话说回来,谁又会闲的没事把它们硬是“放大”为720P乃至1080P呢?
对于日常番,及其他场景较为简单的番剧,以及以日常生活为主题的电视剧,也可以压制为较低码率的480P。
对于讲义讲座朗诵演讲类视频,乃至幻灯片(PPT)视频,可以采用更低的码率及帧率进行压制。甚至干脆将其中的音频提取出来而舍弃视频流——当然,如果不考虑其中所带的字幕,或者出现的图表及图示的话。
对于口齿清晰,但动作表现力不足的曲艺相声视频,也可以单独提取其音轨出来。
对于体积较大,又舍不得再二压其视频流的视频,可以将其音频提取出来,并用适度的码率转换为有损的音频,然后再混流进去——制作或重制为MKV格式的视频。
对于包含多语音轨的视频,可以将其中除了出品国语言及母语的外语音轨统统去掉——导演评论音轨除外。
对于已经收藏了实体原盘的影视作品,可以考虑少备份或不备份——或仅备份其字幕文件。
综上所述。而要压制出“码率低、质量优”的视频,这也许不是“用某一款软件进行傻瓜化操作”就轻易可以做到的。对此,除了多研究与尝试网上各路大神的相应教程以外,也不妨去试试现在主流的视频网站的专用压制工具(本地端的——注意,是“本地端的”),这样,也许能够以相对简单的设置,压制(二压)出如同在这些网站上见到的番剧及其他影视作品那样,清晰度较高,体积也不算太大的视频文件。
以在使用这些工具压制的时候,不妨关闭网络。而在压制之后,便将成品及原品移出原来的文件夹。以免可能出现在不知不觉中自动上传。
另外,如上所言,如果在“视频压制与转换”上只会“简单设定几个参数”,基本属于外行(比如伦家),同时出于“平衡视频分辨率与文件大小”,而需要比如将相应的视频从1080P版替换为720P版的话,那么一般而言,还是重找资源为好——反过来,单纯用更换格式与编码,及调解“码率”与“CRF”的方法,这样压制出来的成品,在画面分辨率一定的情况下,其“清晰/码率”,还是不能跟科班出身的影视组、动漫组相比。
4、关于压缩包
前面说的是“压制”,而不是“压缩”。
建议将诸如“网页文件的附带文件夹”,以及“影视压制合集”里的小图像、小音频,以及字幕文件以外的,其他形式的文件压缩成包——同时,建议采取“存储压缩”这种“纯打包”的形式。
压缩散碎文件的意义,还是在于以后再传输及备份那些合集(或在云端上再备一份)的时候,减少因“文件系统错误”或“路径错误”而出现“传输/上传错误”可能性。以及,一定程度上解决大部分存储介质在“非顺序读写”时速度较慢的问题。
而“纯粹打包”的压缩,也是为了尽量避免以后在经历了频繁的传输以后,解压时出现“压缩文件损坏”或其他形式的错误。
另外,建议另备几套能够修复ZIP压缩包中文名称错乱的工具——比如MMDZip。
那么反过来,如果我们比如在简体中文的语言环境里,在压缩一批文件时选择“在压缩包里使用unicode(UTF8)文件名”的话,那么以后自己或者其他朋友在其他语言环境里打开该包,应该也不会有乱码出现了。
本文采摘于网络,不代表本站立场,转载联系作者并注明出处:https://www.5amiao.com/baike/652.html