宇宙主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

欧基零壹微头条IP归属甄别会员请立即修改密码
楼主: gamerock

1亿5千万的txt打包居然吃掉了31个G的内存!

[复制链接]
 楼主| 发表于 2024-8-25 14:03:14 | 显示全部楼层


自己采集就行了啊!
还不要花钱!
我卖的价格高了,你不开心!
我卖的价格低了,我不开心!
自己采集最划算!
发表于 2024-8-25 14:03:56 | 显示全部楼层
都是旧数据,不是最新的
发表于 2024-8-25 14:04:20 | 显示全部楼层
打包干嘛?搬站?搬过去还得解压。。。
这么大的站流量得多少啊
发表于 2024-8-25 14:05:57 | 显示全部楼层

教你一招,做个脚本,分段生成单个文件,然后单个文件压缩加密,传到hub公共账户就行了,几百G都不需要一天时间,具体操作:
1 文件的aaa.txt的大小为60G,进行拆分,1G为一个文件aaa1.txt,或者10万行一个文件aaa1.txt;
2 对aaa1.txt进行压缩并加密,生成aaa1.tar;
3 构建docker镜像,将加密的aaa1.tar放到镜像文件image_aaa1中;
4 push上传镜像文件image_aaa1到公共仓库,即使有人拉取,破解不了你的密码;
5 用的时候依次拉取,几百G、几千G都可以上传,突破普通网盘容量限制,docker上传速度比大部分收费网盘要好,不存在上传限速

300G的视频,我一天搞定它,hub上现在还存放着呢,都是私人珍藏,高清无码

点评

细说高清无  发表于 2024-8-25 16:31
发表于 2024-8-25 14:13:35 | 显示全部楼层
本帖最后由 xuexing 于 2024-8-25 14:15 编辑

你是win,可以不使用额外工具,先查看总文件有多少行,按行提取就行了,比如总用有100万行,一次提取10万行,脚本循环,下一次提取100001-200000的数据,生成aaa1.txt,单独对它进行压缩,思路基本就是这样,具体脚本扔给gpt搞定就行,循环提取,循环压缩,循环上传到hub docker,我发现hub真是好东西,上传不限速,而且还是无线容量
 楼主| 发表于 2024-8-25 14:19:43 | 显示全部楼层
xuexing 发表于 2024-8-25 14:13
你是win,可以不使用额外工具,先查看总文件有多少行,按行提取就行了,比如总用有100万行,一次提取10万行 ...


单个单个txt文件啊!
不搞哪些乱七八糟的!
别到时候用不了就麻烦了!
发表于 2024-8-25 14:30:35 | 显示全部楼层
本帖最后由 xuexing 于 2024-8-25 14:32 编辑
gamerock 发表于 2024-8-25 14:19
单个单个txt文件啊!
不搞哪些乱七八糟的!
别到时候用不了就麻烦了! ...


随便找个文件,测试一下呗,你先记录sha256,然后让gpt给你做个脚本,分段切分成100个小文件,然后再让gpt给你做一个合并100个txt的脚本,看看是不是原来的sha256就行了。
上传到hub和下载也是一样,执行完看看是否和最初的sha256一致。这个方法是不会错的,如果错了,那就是你执行的环节出了问题,让gpt给你排查。

不想搞这些复杂的,那你就搞钱升级大容量网盘,速度还没hub快,很多都上传限速,你说还有半个月时间,那就慢慢搞,要想快速,想一天搞定,那就要折腾。
发表于 2024-8-25 14:37:00 | 显示全部楼层
不建议打包的方式,建议同步采集的方式搬站。 另外一台部署一下直接从这边采集数据。
 楼主| 发表于 2024-8-25 14:53:28 | 显示全部楼层
xuexing 发表于 2024-8-25 14:30
随便找个文件,测试一下呗,你先记录sha256,然后让gpt给你做个脚本,分段切分成100个小文件,然后再让gp ...


恩,感谢提供方案!
发表于 2024-8-25 21:18:42 | 显示全部楼层
xuexing 发表于 2024-8-25 14:05
教你一招,做个脚本,分段生成单个文件,然后单个文件压缩加密,传到hub公共账户就行了,几百G都不需要一 ...

300T的高清步兵,可以操作吗
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|宇宙主机交流论坛

GMT+8, 2024-10-31 13:18 , Processed in 0.063312 second(s), 7 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表