留园首页
新闻速递首页
热评新闻榜
新闻评论公告
72小时神评妙论
即刻热度新闻
查看原文:
“DeepSeek甚至绕过CUDA”论文细节再引热议(组图)
》》发表评论
》》本页热评
[
28
楼]
评论人:
炅龙
[★品衔R6★]
[
个人频道
]
[
个人动态
]
发送时间:
2025年01月29日 16:21:36
【回复】
使用PTX汇编级编程,产出代码是可能优化了,但编程可能效率就降低了。更可能的是Deep Seek用PTX自己构建了类似CUDA和CUDA库的架构,但自己的架构比英伟达的更有效率更好。这样他们自己内部代码开发才更有效率,可能Deep Seek本身就能为他们的内部架构编程产生代码以替代码农。这个内部类CUDA及库是闭源的,所以他们对这个架构的产物Deep Seek就有信心开源了。猜想而已。
4
踩
[
27
楼]
评论人:
细佬会向上
[☆品衔R3☆]
[
个人频道
]
[
个人动态
]
发送时间:
2025年01月29日 16:21:32
【回复】
反华狗又看到一个吐槽点,通用性很差,不足为惧,哈哈
2
踩
[
26
楼]
评论人:
未知星球
[★品衔R6★]
[
个人频道
]
[
个人动态
]
发送时间:
2025年01月29日 14:02:51
【回复】
有时并不需要移植,作为底线AI大佬只要能流畅就可以了.
赞
踩
[
25
楼]
评论人:
mastGD
[☆品衔R4☆]
[
个人频道
]
[
个人动态
]
发送时间:
2025年01月29日 12:16:18
【回复】
就是说CUDA 很垃圾,就给你重新写了一个。
3
踩
[
24
楼]
评论人:
路人丫丫
[★必举报说脏话★]
[
个人频道
]
[
个人动态
]
发送时间:
2025年01月29日 11:10:49
【回复】
回复
23
楼:
呵呵。。。牛逼吹上天了,既然有这样的实力,干嘛还用NVDA的芯片呢?为啥不用国产的摩尔线程?是因为要卖国做汉奸吗?🤣
3
4
[
23
楼]
评论人:
不忙
[☆品衔R3☆]
[
个人频道
]
[
个人动态
]
发送时间:
2025年01月29日 10:48:37
【回复】
Deepseek有实力自己写一套compiler开源给所有人,完全绕过cuda, 而且通用所有的GPU. deepseek可以不用cuda的定义,重新定义一套,兼容所有GPU. 从它公布的技术报告看完全有这个实力。这才是nvidia真正担心的。反正所有人都是用python写的。绕过CUDA没有任何压力。
4
踩
1
[
22
楼]
评论人:
不忙
[☆品衔R3☆]
[
个人频道
]
[
个人动态
]
发送时间:
2025年01月29日 10:48:31
【回复】
Deepseek有实力自己写一套compiler开源给所有人,完全绕过cuda, 而且通用所有的GPU. deepseek可以不用cuda的定义,重新定义一套,兼容所有GPU. 从它公布的技术报告看完全有这个实力。这才是nvidia真正担心的。反正所有人都是用python写的。绕过CUDA没有任何压力。
2
踩
[
21
楼]
评论人:
专打丧家犬
[☆品衔R4☆]
[
个人频道
]
[
个人动态
]
发送时间:
2025年01月29日 10:39:47
【回复】
狗永远都是吃屎喷粪,不会理智发表自己的见解!看看下面某些东西的喷粪就知道
5
踩
[
20
楼]
评论人:
Edmondon
[♂☆★声望品衔7★☆♂]
[
个人频道
]
[
个人动态
]
发送时间:
2025年01月29日 10:22:48
【回复】
就是相当于用汇编语言编程而不是C++,当然效率提高很多,唯一缺陷是维护难度高,不过国内聪明人那么多,肯定想出来什么好办法
4
踩
[
19
楼]
评论人:
netcamel
[★★声望品衔10★★]
[
个人频道
]
[
个人动态
]
发送时间:
2025年01月29日 10:04:59
【回复】
【 有开发者认为,「底层GPU编程才是正确的方向。优化得越多,就越能降低成本,或在不增加额外支出的情况下,提高可用于其他方面进步的性能预算」】
中国的体制最适合啃硬骨头,
当年用算盘和笔都能搞出原子弹,把卫星送上天,
现在鸟枪换导弹,
等真的再次集中资金、人才,
以世界第二的地位办本应是商业范畴之事,
真没啥悬念。
就看美国打压到哪一步,
毕竟现在中国的理念是开放。
6
踩
[
18
楼]
评论人:
意见没
[☆★声望品衔7★☆]
[
个人频道
]
[
个人动态
]
发送时间:
2025年01月29日 10:04:50
【回复】
deepseek这种做法必须是对硬件结构很了解,并且是算法与具体硬件系统工程师之间紧密合作才能实现,这更多的是需要电子与计算机工程背景的工程师。所以像OpenAI这种主要靠算法及计算机编程的公司还很难做到
11
踩
[
17
楼]
评论人:
alien
[☆品衔R4☆]
[
个人频道
]
[
个人动态
]
发送时间:
2025年01月29日 9:55:40
【回复】
回复
15
楼:
做quantitative trading 的一定要对硬件的架构 懂才可以做优化,任何operating system 都做不了nanosecond的延迟.要用FPGA level or assembly level optimization. 这不等于硬件芯片的设计,是两回事
2
踩
[
16
楼]
评论人:
塔玛的隔壁
[★★声望品衔9★★]
[
个人频道
]
[
个人动态
]
发送时间:
2025年01月29日 9:07:29
【回复】
中国学霸未来的去向,让我们拭目以待
2
2
[
15
楼]
评论人:
不忙
[☆品衔R3☆]
[
个人频道
]
[
个人动态
]
发送时间:
2025年01月29日 9:02:44
【回复】
说明deepseek对硬件有很深的理解。跟其他公司合作,比如AMD,没有任何压力。
10
踩
1
[
14
楼]
评论人:
不忙
[☆品衔R3☆]
[
个人频道
]
[
个人动态
]
发送时间:
2025年01月29日 9:01:17
【回复】
能把cuda 护城河给拆掉的,只能是中国人。
17
踩
[
13
楼]
评论人:
qqworker
[♂☆★皿煮就别拉黑★☆♂]
[
个人频道
]
[
个人动态
]
发送时间:
2025年01月29日 8:36:55
【回复】
其实之前美国很多核心科技是美籍华人搞出来的。。
排斥华人是最傻的行为了。。
20
踩
[
12
楼]
评论人:
穆斯塔法
[☆品衔R4☆]
[
个人频道
]
[
个人动态
]
发送时间:
2025年01月29日 8:26:30
【回复】
犹太昂撒的老钱,这两天都被捂在七大股票里出不来跌惨了,怎么救市呢,只能动用犹太昂撒的另一只手,就是媒体造谣,同时加上网络攻击让无法访问,同时绝望地拉高迷惑一些人然后拼命出货,
这些加在一起,完全是绝望自救的表现
22
踩
[
11
楼]
评论人:
anywho
[☆品衔R4☆]
[
个人频道
]
[
个人动态
]
发送时间:
2025年01月29日 8:24:48
【回复】
連AMD都與DeepSeek 合作、
還是那句:
識時務者為俊傑!
来自留园官方客户端
6
踩
[
10
楼]
评论人:
8gu
[☆品衔R4☆]
[
个人频道
]
[
个人动态
]
发送时间:
2025年01月29日 8:24:48
【回复】
一帮中国学霸追求极致,有时仅仅是为了炫耀智力优越感。不服气?有的是人陪你玩,
11
踩
[
9
楼]
评论人:
bigsloth
[★品衔R5★]
[
个人频道
]
[
个人动态
]
发送时间:
2025年01月29日 8:23:58
【回复】
回复
5
楼:
问题是你的设定和算法是否能发挥最大的性能,对于一些特定且频繁的运算,极致的优化确实比一般的代码高出几倍至几十倍的速度,相较于硬件设计上的差异,H100 VS H800,软件细调是填补硬件差异的方法之一。例如你有钱,买了把好刀,但不意味着你切菜一定更快更好,对于同一个厨师,当然更好的刀效果更好,不同的厨师就难说了。
19
踩
回
复
9
楼
用户名:
密码:
[--注册ID--]
[
8
楼]
评论人:
码农
[品衔R2☆]
[
个人频道
]
[
个人动态
]
发送时间:
2025年01月29日 8:21:56
【回复】
用了nccl,谈不上越过cuda,完全是一群文盲。
2
踩
[
7
楼]
评论人:
playatom
[★馒头卷饼盖饭★]
[
个人频道
]
[
个人动态
]
发送时间:
2025年01月29日 8:21:18
【回复】
回复
6
楼:
ddos攻击和号码注册是两回事,这前后没有逻辑的结论是怎么得出来的?DDOS注册啊?
1
2
[
6
楼]
评论人:
爸爸老爹
[☆隔壁老李☆]
[
个人频道
]
[
个人动态
]
发送时间:
2025年01月29日 8:17:23
【回复】
回复
4
楼:
·
由于来自美国的DoS攻击太多,目前只接受用中国手机号码注册。
看来美国的AI大厂是真慌了。
15
踩
1
[
5
楼]
评论人:
moonray
[☆品衔R4☆]
[
个人频道
]
[
个人动态
]
发送时间:
2025年01月29日 8:04:27
【回复】
搞错了吧, GPU 是按软件计算量来设计硬件, 而不是软件按硬件来设计。
赞
踩
1
[
4
楼]
评论人:
想拿钱的愤青
[☆品衔R4☆]
[
个人频道
]
[
个人动态
]
发送时间:
2025年01月29日 8:03:59
【回复】
用不了了,被美国ip攻击服务器挂了吧
赞
3
1
[
3
楼]
评论人:
jiapinhui
[品衔R1]
[
个人频道
]
[
个人动态
]
发送时间:
2025年01月29日 8:02:59
【回复】
牛啊
3
踩
[
2
楼]
评论人:
喝地沟油扒墙头的猪
[♂☆品衔R3☆♂]
[
个人频道
]
[
个人动态
]
发送时间:
2025年01月29日 8:00:57
【回复】
DeepSick🤣🤣🤣
1
4
[
1
楼]
评论人:
小曉古今
[★品衔R5★]
[
个人频道
]
[
个人动态
]
发送时间:
2025年01月29日 7:57:27
【回复】
正在重蹈2000年互连网泡沫
12
踩
新闻评论原文:“DeepSeek甚至绕过CUDA”论文细节再引热议(组图)
本文热评:
12
楼
评论:
穆斯塔法
[☆品衔R4☆] 01月29日 8:26:30
22赞
0踩
0评
》》》查看12楼点评详情
犹太昂撒的老钱,这两天都被捂在七大股票里出不来跌惨了,怎么救市呢,只能动用犹太昂撒的另一只手,就是媒体造谣,同时加上网络攻击让无法访问,同时绝望地拉高迷惑一些人然后拼命出货,
这些加在一起,完全是绝望自救的表现
获赞最多的网友评论,将自动推送到
留园神评妙论荟萃
;
更快更便捷,留园手机客户端下载
|
留园《信息市场》免费发布,推广!
新闻速递首页
|
注册留园笔名
|
即刻热度新闻
|
热评新闻排行
|
评论区公告
|
留园社区网选董事
|
【繁體閱讀】
[
留园首页
] [
留园条例
] [
广告服务
] [
联系我们
]
Copyright (C) 6park.com All rights Reserved.