Cities are complex, which I think most people will agree with. How to uncover the mysterious veil of cities seems quite challenging but also attractin
...
The Ternary Space
The day before yesterday, I came across a vivid explanation of the concepts of artificial intelligence and digital economy from CAS Academician XU Zon
...
场上场下
六月中旬以来,正值世界杯如火如荼之际。近来情绪不佳,正好借世界杯聊以排遣。从前没有太多耐性看完整场的比赛,而现在却以打发时间的心态看完了一场又一场。令人欣喜的是,看球给了我新的体悟。场上球赛,场下生活,何其相似。
现在的西班牙,看着让人心疼。光有控球,没有进球,一样没用。和日常瞎忙的我,一样一样的。
...
关于写论文的一点感悟
突然发现,写论文就像是“自问自答”。“问”的要有意义,“答”的要有逻辑。“问”需要信息搜索和总结归纳能力,“答”需要数理技术和逻辑论证能力。
写论文这个“自问自答”,没有唯一的标答,需要的是自圆其说的故事。
一个人的旅行——巴黎篇
一个人的旅行——意大利篇
一个人的旅行——北爱篇
沃莱顿公园的长椅
沃莱顿公园的长椅,每一条都藏着一个故事,每一条都存着一份思念。
大爱言叶之庭
原文:
雷神小动,刺云雨零耶,君将留?
雷神小动,虽不零,吾将留妹留者。
日文:
鸣神の 少しとよみて さし昙り 雨も降らんか 君を留めん
鸣神の 少しとよみて 降らずとも 我は止まらん 妹し留めば
译文:
隐约雷鸣 阴霾天空 但盼风雨来 能留你在此
隐约雷鸣 阴霾天空 即使天无雨 我亦留此地
— 雷神短歌 《万叶集》
大文件排序
缘起
昨晚,小平问我如何对大文件进行分割。虽然目前她没有对大文件进行排序的需求,但我想以后很可能会用到。
我想了一个解决方法,是先将大文件分割为若干子文件,然后将各子文件分别加载在内存中进行排序,最后将各排好序的子文件合并为大文件。但是这种方法要求各子文件之间的大小已经确定。以升序为例,即对于子文件 f1, f2, ..., fn
,要求 any(f1) <= any(f2) <= ... <= any(fn)
,这样最好的简单合并才能确保所有记录的有序。
因此,我提出,在划分子文件前,要先遍历大文件一次,统计各数值出现的次数,然后按分布来确定几个分割的阈值,再遍历大文件各条记录,按阈值划分子文件。
以上我的解决方案是可行的,但是我想应该不是最优的,对于子文件的划分有些麻烦。我想看看别人是怎么解决大文件排序问题的,因此这个问题应该很典型了。然后我发现了外部排序,这是和内部排序相对的存在,我以前竟然不知道,看来还是对数据结构及算法学的不够系统。