2025/07/04 16:00 · 星合の空
和 Tilelang 群友友好交流了之前关于 L2 优化矩阵乘算法的疑问,本文基于 Tilelang 实现 matmul 算子,验证 L2 swizzle 算法。或许是哪里写的有问题,现在的代码性能或许不及预期,且存在显存泄露情况。待和群友进一步请教。
2025/07/04 16:00 · 星合の空
和 Tilelang 群友友好交流了之前关于 L2 优化矩阵乘算法的疑问,本文基于 Tilelang 实现 matmul 算子,验证 L2 swizzle 算法。或许是哪里写的有问题,现在的代码性能或许不及预期,且存在显存泄露情况。待和群友进一步请教。
2025/06/24 16:00 · 星合の空
本文为我在 DAC 会议介绍自己的工作 GoPTX 的内容。
2025/06/20 16:00 · 星合の空
上一次为生日写文字,还是 2022 年,那一年我作出了转博的决定。每年回望那天导师说的话,每年都有新的感受。 作为导师的第一个学生,我在体系结构的山谷中跋涉两年,最终推翻重来,转身编译领域,成为中大在这个方向第一/唯一一个博士生。这条折返之路,让博士开题一路延期到了博三下;或许经历过博士旅途的人,更能体会这句话的重量。每一步的探索与修正,都印证着导师的话:极限之外,浴火新生。 今天专程飞回学校,和发小拍下了毕业照;我送别了本科时代最后两届有密切联系的同学。故人远去,一些复杂的情感在挥手时悄然立起。 在人生最低谷的时间里,我时常回看 2022 年 DRX 的旅途。命运如此巧合:一篇论文被接收,会议的举办地点恰巧在生日那天的旧金山。那个瞬间,管泽元的激情解说穿越时空在耳畔回响——“DRX要去旧金山了!” Chase Center 山呼海啸的声浪,在我心中轰鸣。 虽然因为签证与会议错过,得而复失,留下遗憾,但心中的执念并不熄灭。有朝一日,有生之年,一定要在旧金山玩一次跳伞,飞跃金门大桥上的天空。 在论文里悄悄留了一个彩蛋:使用了 miku 配色,即使在黑白打印稿上,也能清晰分辨。也曾想过用水野爱的蓝红应援色,最终割爱。 这个小小的坚持,是我向这段岁月的致意。
2025/04/04 16:00 · 星合の空
TBD
2025/04/03 16:00 · 星合の空
TBD
2025/04/02 16:00 · 星合の空
TBD
2025/04/01 16:00 · 星合の空
TBD
2025/03/31 16:00 · 星合の空
TBD
2025/03/02 16:00 · 星合の空
五年前我曾经尝试过 Volta 上的 GEMM,能够接近当时 CUTLASS 的水平,可惜其可读性一直没达到能让自己满意的水平。拜读一下 DeepGEMM,一句话评价:比 CUTLASS 简洁、好上手(CUTLASS 为了兼容各种 Shape 和 Case 做了过于多的抽象,难以读懂的同时算法上束手束脚,DeepGEMM 只针对自己用的Contiguous Layout),很适合阅读。比较佩服的一点是 DS 能够自信自己的工程师技术水平优于 NV CUTLASS 团队的水平,敢于开启这个项目:从代码规模来看,整个项目很可能是单挑的(一个精巧的代码设计需要一个自上到下对算法细节全部精通的工程师),给我几个月不一定能写出来(写一个代码结构差不多的有可能,Debug 多久就要看命了)…
2025/02/10 16:00 · 星合の空
《宝可梦传说·阿尔宙斯》一周目通关,游玩时间约 36 小时,游戏内容远比想象中的少。
通知内容