tags
type
status
date
slug
summary
category
password
icon

第一轮

马pj/吴yx [贾天宇] CPU uopcache 在cpu的pipeline中,我们需要把复杂的指令decode成简单的基本指令,这一步骤需要大量能耗。我们可以把一部分指令解码的结果存在缓存里,称为uopcache
夏ml [梁云] 利用llm来进行硬件的纠错和修复
范jl/沈t [程哲] 界面热导率。异质集成:把负责电学特性和热学特性的材料集成到一起 TDTR:pump光分两束。一束红光用来检测热信号,一束倍频后变成蓝光用来加热样品。通过位移台,红光可以与蓝光有一个微秒级别的时间差。通过不同时间差,我们就可以得到材料的热导率。
杨tj/汤zy [李萌] CPU/GPU异质架构的KV Cache
王zm/罗yh[林亦波] 物理布线对系统延时的影响
王yx[李萌] Chain of Thought
许jy/姚jy[唐希源] SAR ADC二分算法逐步逼近
吴th/刘yc[吴腾]
李cw/马hr[常林] 电信号的射频域和光信号的光频域存在数量级的差别 光频梳使得二者能在同一个数量级上
高hy[李萌] MoT
安zh/杨xx[林亦波] 基于netlist给出硬件布局 最小斯坦纳树是一个NP-hard问题

企业轮转

  • (海思)刘yc:芯片塑料封装(EMC材料)
  • (海思)王yx:Sense Amplifier
通过两级latch管可以优化灵敏度(delta V)和mismatch,前一级的输出相当于是SA的输入
  • (海思)马pj:Pulse Latch & 传输门
Pulse Latch:用Latch(是单个Latch,不是DFF)替换SRAM的bitcell,Latch本身面积较大,但不需要prech/SA等外部电路,因此在存储数据量较小时Pulse Latch具有优势;另外对setup time能提升余裕,因为只需要数据在高电平区间到达即可,无需在上升沿之前到达
传输门:很难带来速度提升,但是对功耗和面积有优化
  • (海思)王zm:材料的焊接(烧结银)
  • (华为)安zh/杨xx:SEU(单比特错误,占辐射99%以上)
原理:高能粒子通过PN结产生电子-空穴对,产生电流超过翻转阈值
TMR:把关键部分的代码复制三份,用投票器投票。但投票器只有一个,需要保护(比如面积越小越好)
CRC校验:模2多项式运算
用的国产FPGA,没法用Xlinx
  • (华为)高hy/马yy:NAND FLASH配置FMC(flash memory control)
为什么要有FMC?NAND FLASH比较慢,不想让cpu等着
NVIDIA调研:从卷算力到拼互联;从硬件到生态
  • (华为)马hr/姚jy:信道干扰测试
SerDes是串行器和解串器的简称
时钟恢复电路(CDR):用锁相环从传输的数据中直接提取时钟信号
通信不光是无线通讯,还有有线通讯
  • (心言)赵tb/王xl:给音频打情感标签
  • (知存)郭fy/许jy:存算Tuning精度优化
浮栅内电子数量可以改变阈值电压和阻抗大小,一个cell能存储SINT8
问题在于各个cell性能有偏差
类似二分的方法把电子数量调节到需要的值
  • (知存)沈t/罗yh:存算Tuning速度优化
有些cell很敏感,有些cell很顽固需要加大电压
  • (后摩)汤zy:模型量化
块浮点:一块数据共享同一个指数
离群值:乘正交矩阵,把离群值平均到其他维度上,从而平均量化时误差较小
向量量化:用kmeans,一个向量对应一个格点
  • (知存)范jl/肖ky:3DIC热管理
知存芯片的准确度要求芯片各点温差(不仅仅是最高温度)不能太大
通过热补偿来平衡全芯片温度
  • (后摩)夏ml:AI编译器
后摩用的是sram存算
计算图优化用到异构图强化学习
  • (华为)吴yx/吴th:wlan测距定位
Hypergraph会议与期刊
Loading...