i***r 发帖数: 1035 | 1 我对R 不是很熟。
如果只说一个的话,我觉得是
R is designed for STATISTICAL analysis, while
Matlab is designed for NUMERICAL analysis
请指教 |
n******7 发帖数: 12463 | 2 一个商业软件,一个OSS
【在 i***r 的大作中提到】 : 我对R 不是很熟。 : 如果只说一个的话,我觉得是 : R is designed for STATISTICAL analysis, while : Matlab is designed for NUMERICAL analysis : 请指教
|
z****e 发帖数: 54598 | 3 那要这么说的话,都应该去用fortran
数值计算和统计本身有大量重叠的部分
实际上r的pkg也有大量的fortran写的东西
这些领域本身互相之间的界限就很模糊
如果其中一个领域得到了一定的发展
我想,其他领域也是可以借鉴和参考这个领域的发展的
r现在renjin做得很有道理 |
z****e 发帖数: 54598 | 4 然
不过这个不是主要区别
sas vs matlab也可以说下去
【在 n******7 的大作中提到】 : 一个商业软件,一个OSS
|
i***r 发帖数: 1035 | 5 那matlab 能够和硬件直接沟通,R不能,这个算不算?
要不大牛说一个?
【在 z****e 的大作中提到】 : 然 : 不过这个不是主要区别 : sas vs matlab也可以说下去
|
z****e 发帖数: 54598 | 6 matlab主要是给research用
在真正企业内部,用的人真心不多
r相比之下,因为统计本身就是一个非常实用的学科
统计和cs并称为两大应用数学分支
所以在企业内部有大量的应用
最常见的就是统计和商业的交叉精算
这个已经远不仅仅是学科了,早就发展成为一门很严谨的专业了
所以统计和精算的人士对于r有大量需求
主要是sas太贵了,一旦这种开源的东东形成规模
对于sas的冲击是非常巨大的
matlab还需要思考一下,现实中企业有哪些专业需要这个东西 |
i***r 发帖数: 1035 | 7 这不算是软件本身的区别吧,只是获取软件途径和代价不同吧
【在 n******7 的大作中提到】 : 一个商业软件,一个OSS
|
g*****g 发帖数: 34805 | 8 我觉得matlab牛逼还是在于简单吧,没学过编程的也能写个简单脚本就来个回归画图啥
的。
【在 i***r 的大作中提到】 : 我对R 不是很熟。 : 如果只说一个的话,我觉得是 : R is designed for STATISTICAL analysis, while : Matlab is designed for NUMERICAL analysis : 请指教
|
z****e 发帖数: 54598 | 9 renjin可以编译成byte code
有些硬件可以直接跑byte code啊
这个早就实现了,不过这个提升的效率很有限
真心无必要
现在r跟sas的差别已经很小了
主要差距在于
据说,这个无法严格论证
对于 超大 数据
sas比r要快
【在 i***r 的大作中提到】 : 那matlab 能够和硬件直接沟通,R不能,这个算不算? : 要不大牛说一个?
|
z****e 发帖数: 54598 | 10 r其实也很简单
【在 g*****g 的大作中提到】 : 我觉得matlab牛逼还是在于简单吧,没学过编程的也能写个简单脚本就来个回归画图啥 : 的。
|
|
|
i***r 发帖数: 1035 | 11 同意。R其是跟matlab很像
不过有人问我matlab 和R 最大的区别是什么,我想来想去都是些 minor 的
【在 z****e 的大作中提到】 : r其实也很简单
|
z****e 发帖数: 54598 | 12 统计这块renjin如果能做成
r应该能够摆脱以往只有学术界才用的传统形象
【在 i***r 的大作中提到】 : 同意。R其是跟matlab很像 : 不过有人问我matlab 和R 最大的区别是什么,我想来想去都是些 minor 的
|
i***r 发帖数: 1035 | 13 对了,matlab 里面的数字默认是 double,比如a=1,a其实是double
R里面的数字,例如a<-1,默认是int 吗?
【在 z****e 的大作中提到】 : 统计这块renjin如果能做成 : r应该能够摆脱以往只有学术界才用的传统形象
|
r*g 发帖数: 3159 | 14 r 归类于functional programmin language, 可函数返回/传入函数。
matlab是典型过程编程语言。加了面向对象也不方便,还慢。
【在 i***r 的大作中提到】 : 我对R 不是很熟。 : 如果只说一个的话,我觉得是 : R is designed for STATISTICAL analysis, while : Matlab is designed for NUMERICAL analysis : 请指教
|
z****e 发帖数: 54598 | 15 不知道,你试一下不就知道了
给一个超级大的数字
【在 i***r 的大作中提到】 : 对了,matlab 里面的数字默认是 double,比如a=1,a其实是double : R里面的数字,例如a<-1,默认是int 吗?
|
q*c 发帖数: 9453 | 16 matlab 那些三维画图牛屄的很 啊。
【在 z****e 的大作中提到】 : r其实也很简单
|
n******7 发帖数: 12463 | 17 基本上matlab能做的R也能,R能做的matlab也能
所以主要区别就是一个free 一个要钱了
这就决定了很多事情
【在 z****e 的大作中提到】 : 然 : 不过这个不是主要区别 : sas vs matlab也可以说下去
|
n******7 发帖数: 12463 | 18 我最近才发现原来R也可以这样写
'+' (1,2)
【在 r*g 的大作中提到】 : r 归类于functional programmin language, 可函数返回/传入函数。 : matlab是典型过程编程语言。加了面向对象也不方便,还慢。
|
n******7 发帖数: 12463 | 19 我朋友说R说优化不如matlab
可能是开源包质量参差不齐的缘故吧
【在 i***r 的大作中提到】 : 同意。R其是跟matlab很像 : 不过有人问我matlab 和R 最大的区别是什么,我想来想去都是些 minor 的
|
i***r 发帖数: 1035 | 20 过程编程语言 == procedural programming language?
【在 r*g 的大作中提到】 : r 归类于functional programmin language, 可函数返回/传入函数。 : matlab是典型过程编程语言。加了面向对象也不方便,还慢。
|
|
|
P****S 发帖数: 2286 | 21 Matlab最近几年在并行运算方面发展比较快。几行代码就可以实现小规模的CPU和GPU的
并行运算。R在这方面不知做的怎么样?
【在 n******7 的大作中提到】 : 基本上matlab能做的R也能,R能做的matlab也能 : 所以主要区别就是一个free 一个要钱了 : 这就决定了很多事情
|
i***r 发帖数: 1035 | 22 原来R里面也是默认double。
> a<-8
typeof(a)
[1] "double"
> a<-8L
> typeof(a)
[1] "integer" |
z****e 发帖数: 54598 | 23 用了jvm就好了
这方面jvm是行家
所以我看好renjin
【在 P****S 的大作中提到】 : Matlab最近几年在并行运算方面发展比较快。几行代码就可以实现小规模的CPU和GPU的 : 并行运算。R在这方面不知做的怎么样?
|
z****e 发帖数: 54598 | 24 3d图像这一块的确是java的弱项
现在在搞javafx,通过底层的opengl api来优化效率
【在 q*c 的大作中提到】 : matlab 那些三维画图牛屄的很 啊。
|
z****e 发帖数: 54598 | 25 paradigm互相之间不冲突啊
你可以同时是两种不同的paradigm
【在 i***r 的大作中提到】 : 过程编程语言 == procedural programming language?
|
z****e 发帖数: 54598 | 26 其实脚本很多都不行
所以都忙着往jvm上搬家
都知道jvm效率高
【在 n******7 的大作中提到】 : 我朋友说R说优化不如matlab : 可能是开源包质量参差不齐的缘故吧
|
f**********r 发帖数: 2137 | 27 matlab(matlab=matrix laboratory)精髓是矩阵,其他都很慢,所有过程式的思路最好都
转化成矩阵表示,当然这个很考功力
【在 r*g 的大作中提到】 : r 归类于functional programmin language, 可函数返回/传入函数。 : matlab是典型过程编程语言。加了面向对象也不方便,还慢。
|
z****e 发帖数: 54598 | 28 r主要是给统计的人用的
所以结合统计这个学科看
三纬成像什么需求不怎么高
现在工业界对于统计这个学科的需求空前高涨
主要是big data的流行
ai/ml都需要用到大量的统计
而r本身在工业界要做集成什么很难搞
因为r本身很慢
怎么优化都弱,这一行比较赚钱的是sas
骗了不少钱走
所以renjin很有必要弄出来,弄出来之后
被冲击最大的肯定不是matlab之类的
sas肯定首当其冲
所以对比matlab有些苹果比橘子
倒是python vs matlab有一定可能性 |
n******7 发帖数: 12463 | 29 R也差不多,尽量让操作都vectorize,不然很慢
【在 f**********r 的大作中提到】 : matlab(matlab=matrix laboratory)精髓是矩阵,其他都很慢,所有过程式的思路最好都 : 转化成矩阵表示,当然这个很考功力
|
n******7 发帖数: 12463 | 30 这个我不熟,等牛人来说说
matlab要是很容易利用上CPU和GPU的话,是个很大的plus
R随便搜了一下,也有不少包,不知道用起来如何
http://cran.r-project.org/web/views/HighPerformanceComputing.ht
【在 P****S 的大作中提到】 : Matlab最近几年在并行运算方面发展比较快。几行代码就可以实现小规模的CPU和GPU的 : 并行运算。R在这方面不知做的怎么样?
|
|
|
i***r 发帖数: 1035 | 31 我仔细比较了一下两个语言,觉得最大的区别就是 function call
matlab 和 R 的function call 都很独特
matlab 的function 必须单独文件,totally positional
R 的表现方式很独特,用foo$bar()格式
【在 n******7 的大作中提到】 : R也差不多,尽量让操作都vectorize,不然很慢
|
n******7 发帖数: 12463 | 32 你是说numpy vs matlab吗?
这两个都不是一个量级的吧
【在 z****e 的大作中提到】 : r主要是给统计的人用的 : 所以结合统计这个学科看 : 三纬成像什么需求不怎么高 : 现在工业界对于统计这个学科的需求空前高涨 : 主要是big data的流行 : ai/ml都需要用到大量的统计 : 而r本身在工业界要做集成什么很难搞 : 因为r本身很慢 : 怎么优化都弱,这一行比较赚钱的是sas : 骗了不少钱走
|
z*******h 发帖数: 346 | 33 Matlab上有simulink, R有吗?
【在 n******7 的大作中提到】 : 基本上matlab能做的R也能,R能做的matlab也能 : 所以主要区别就是一个free 一个要钱了 : 这就决定了很多事情
|
z*******h 发帖数: 346 | 34 一个有很好的文档,一个有很破的文档。一个很贵,一个免费。
【在 i***r 的大作中提到】 : 我对R 不是很熟。 : 如果只说一个的话,我觉得是 : R is designed for STATISTICAL analysis, while : Matlab is designed for NUMERICAL analysis : 请指教
|
d******k 发帖数: 4295 | 35 几年前在学校都是matlab vs Octave, SAS vs R。
怎么现在 matlab 都和r干上了?
【在 i***r 的大作中提到】 : 我对R 不是很熟。 : 如果只说一个的话,我觉得是 : R is designed for STATISTICAL analysis, while : Matlab is designed for NUMERICAL analysis : 请指教
|
n****6 发帖数: 570 | 36 r统计用的。无数的包和统计库。你不用造轮子了,和高统计的人叫流就得用r
【在 d******k 的大作中提到】 : 几年前在学校都是matlab vs Octave, SAS vs R。 : 怎么现在 matlab 都和r干上了?
|
d******k 发帖数: 4295 | 37 这个。。。。。。我说的跟你不矛盾吧
【在 n****6 的大作中提到】 : r统计用的。无数的包和统计库。你不用造轮子了,和高统计的人叫流就得用r
|
v*******e 发帖数: 11604 | 38
是matlab vs Octave, S-plus vs R.
现在S-Plus被R干掉了,所以有人就SAS vs R了。
Octave的开发模式不行,一个人单打独斗,不像R那样team work。所以也没做大。
SAS存活的最大支持, 1 是FDA用SAS。2 是legacy code。SAS估计迟早是COBOL的命。
Octave如果改用R的开发模式,大概有10多年可能搞死Matlab。如果不改,那就没可能
。
【在 d******k 的大作中提到】 : 几年前在学校都是matlab vs Octave, SAS vs R。 : 怎么现在 matlab 都和r干上了?
|
n******7 发帖数: 12463 | 39 这个倒是真没有,得跟octave scilab之类比了
【在 z*******h 的大作中提到】 : Matlab上有simulink, R有吗?
|
n******7 发帖数: 12463 | 40 这几个中间matlab R最流行
就学校里面搞搞model,算法来说,这两个基本可以互换吧
【在 d******k 的大作中提到】 : 几年前在学校都是matlab vs Octave, SAS vs R。 : 怎么现在 matlab 都和r干上了?
|
|
|
n******7 发帖数: 12463 | 41 为啥说octave是一个人在搞?
不也是GNU license吗
【在 v*******e 的大作中提到】 : : 是matlab vs Octave, S-plus vs R. : 现在S-Plus被R干掉了,所以有人就SAS vs R了。 : Octave的开发模式不行,一个人单打独斗,不像R那样team work。所以也没做大。 : SAS存活的最大支持, 1 是FDA用SAS。2 是legacy code。SAS估计迟早是COBOL的命。 : Octave如果改用R的开发模式,大概有10多年可能搞死Matlab。如果不改,那就没可能 : 。
|
d******k 发帖数: 4295 | 42 我以前在学校的时候,应数,EE,和其他工程专业都是Matlab,涉及到统计的部分会用
一下R。比如把matlab的结果导出,用R做一下Cluster Analysis。
统计系的老教授教课都是sas为主,年轻老师和学生都是用R。
【在 n******7 的大作中提到】 : 这几个中间matlab R最流行 : 就学校里面搞搞model,算法来说,这两个基本可以互换吧
|
n*****3 发帖数: 1584 | 43 One major diff is R is open source, you can
write c/c++ code calling R header/library directly,
in this way, with c/c++, you can build some
performance critical system without 再造轮子.
我 很好奇renjin 会怎样, 因为 R 和 C/C++
关系 像 python 和 C/C++;
他们 和 JVM/java
不是一挂的.
I guess matlab can not do that? I do not use matlab myself.
【在 z****e 的大作中提到】 : 统计这块renjin如果能做成 : r应该能够摆脱以往只有学术界才用的传统形象
|
w*x 发帖数: 518 | 44 快滚蛋的PHD的一点感觉:
常年用Python + SciPy (因为工作方向的原因,只有比较基础的统计分析,所以scipy
+ scikit完全可以胜任),发了一些东西了,觉得很顺手。
以前是用matlab的,也很好用,但是语言确实比较... ugly, 很多事情要多浪费相当
多时间,毕竟代码重用率相比之下还是略低。
我一个实验室的师兄做的统计稍稍多一些,用不少R + python, 他说R的大量统计包+活
跃的community是python不可比拟的。我感觉statsmodels让python这个方面有很大进步
,但是比R,就现在来说还是差了不少。实话说,我更喜欢python很大一部分原因是因
为这是个real programming language, 用起来比较好玩:)
至于Ruby, Java, C/C++, 前两者科学的库还不成熟,最后的写起来开发效率确实低下
;除非有特别的performance要求,并且用vector优化不起来的,才会去写。(现在有
Cython了,可是每次都看了一眼头大然后直接写C用ctypes调用了……把ctypes当
matlab mex使……)
真心不觉得在学校里面matlab的开源闭源会是一个主要问题,反正有买;industry的事
情不了解,故不评论。 |
c****t 发帖数: 19049 | 45 敢问大牛们在JVM上跑R有啥优势?难道是要把modeling推到前端?有这个vision的知道
model怎么做出来的吗? |
z*******h 发帖数: 346 | 46 所以matlab和R的主要用户群不同,它们不直接竞争。R和SAS, SPSS倒是直接竞争的关
系。matlab的statistics toolbox功能有限,用的人不多。
【在 n******7 的大作中提到】 : 这个倒是真没有,得跟octave scilab之类比了
|
z*******3 发帖数: 13709 | 47 然
统计就用统计的东西
【在 z*******h 的大作中提到】 : 所以matlab和R的主要用户群不同,它们不直接竞争。R和SAS, SPSS倒是直接竞争的关 : 系。matlab的statistics toolbox功能有限,用的人不多。
|
z*******3 发帖数: 13709 | 48 r是单线程的
不止c的接口,当然也有java的接口
但是这样做只能直接call,跑还是跑在慢腾腾的r engine上
相比之下,renjin直接挂到jvm上去跑
用scala来优化loop这些
这个比较抽象
jvm就是一个平台,这个平台上只要是byte code就能跑
jvm不管是不是java写的,你用你自己的语言搞一个都行
只要最后给jvm一个byte code,它就能跑
而renjin是一个r在jvm上的引擎
简单说就是把r写的脚本,编译成byte code,然后交给jvm去执行
所以等于是绕开了java这个东西,这样做的好处就是
直接在jvm上执行,其效率会高于r自身的引擎
这里可以有多线程等操作,而r本身引擎没有这些
【在 n*****3 的大作中提到】 : One major diff is R is open source, you can : write c/c++ code calling R header/library directly, : in this way, with c/c++, you can build some : performance critical system without 再造轮子. : 我 很好奇renjin 会怎样, 因为 R 和 C/C++ : 关系 像 python 和 C/C++; : 他们 和 JVM/java : 不是一挂的. : I guess matlab can not do that? I do not use matlab myself.
|
z*******3 发帖数: 13709 | 49 都是byte code
jvm自身可以做内联等优化处理
jvm执行效率已经超过大多数人手写的c++程序编译后的native code
r就更没有问题了
主要是现在通过调用r的接口,只能跑在r的引擎上
慢
简单说就是,jvm快
【在 c****t 的大作中提到】 : 敢问大牛们在JVM上跑R有啥优势?难道是要把modeling推到前端?有这个vision的知道 : model怎么做出来的吗?
|
z*******3 发帖数: 13709 | 50 r写模型可以,不用写,直接用就好了
算法不知道,没用r写过
matlab其实也是如此,模型多
多数时候不用造轮子
图的不就是一个方便么?
【在 n******7 的大作中提到】 : 这几个中间matlab R最流行 : 就学校里面搞搞model,算法来说,这两个基本可以互换吧
|
|
|
j****x 发帖数: 943 | 51 simulink 不是要另外加钱买吗。还不如整labview
【在 z*******h 的大作中提到】 : Matlab上有simulink, R有吗?
|
j****x 发帖数: 943 | 52 Mathworks 的三哥三姐们加的matlab的面向对象就是一堆垃圾,还有matlab的gui更是
不行。
【在 r*g 的大作中提到】 : r 归类于functional programmin language, 可函数返回/传入函数。 : matlab是典型过程编程语言。加了面向对象也不方便,还慢。
|
j****x 发帖数: 943 | 53 You can call c code from Matlab, or compile matlab code to C.
【在 n*****3 的大作中提到】 : One major diff is R is open source, you can : write c/c++ code calling R header/library directly, : in this way, with c/c++, you can build some : performance critical system without 再造轮子. : 我 很好奇renjin 会怎样, 因为 R 和 C/C++ : 关系 像 python 和 C/C++; : 他们 和 JVM/java : 不是一挂的. : I guess matlab can not do that? I do not use matlab myself.
|
l*********s 发帖数: 5409 | 54 不可能。
【在 z*******3 的大作中提到】 : 都是byte code : jvm自身可以做内联等优化处理 : jvm执行效率已经超过大多数人手写的c++程序编译后的native code : r就更没有问题了 : 主要是现在通过调用r的接口,只能跑在r的引擎上 : 慢 : 简单说就是,jvm快
|
z*******3 发帖数: 13709 | 55 我信,你不信,你可以等下去
【在 l*********s 的大作中提到】 : 不可能。
|
l*********s 发帖数: 5409 | 56 你这话连好虫都不信。
【在 z*******3 的大作中提到】 : 我信,你不信,你可以等下去
|
t*****n 发帖数: 4908 | 57 知道sse优化吗
【在 z*******3 的大作中提到】 : 都是byte code : jvm自身可以做内联等优化处理 : jvm执行效率已经超过大多数人手写的c++程序编译后的native code : r就更没有问题了 : 主要是现在通过调用r的接口,只能跑在r的引擎上 : 慢 : 简单说就是,jvm快
|
z*******3 发帖数: 13709 | 58 take a look at what i posted before
there is a graph
r vs c vs renjin
【在 l*********s 的大作中提到】 : 你这话连好虫都不信。
|
z*******3 发帖数: 13709 | |
z*******3 发帖数: 13709 | 60 p21
【在 l*********s 的大作中提到】 : 不可能。
|
|
|
z*******3 发帖数: 13709 | 61 等renjin稍微成熟点,我们自己试试
好不好?
你们这种老头子对于新生事物接受得很慢
【在 l*********s 的大作中提到】 : 不可能。
|
l*********s 发帖数: 5409 | 62 有意思,等我有空拿c++写个跑跑看
【在 z*******3 的大作中提到】 : p21
|
z*******3 发帖数: 13709 | 63 你用c++能比人家c的快么?
要不要问问好虫同意不同意?
【在 l*********s 的大作中提到】 : 有意思,等我有空拿c++写个跑跑看
|
l*********s 发帖数: 5409 | 64 差不多就行了,java先得干翻了c++才有资格挑战c。
【在 z*******3 的大作中提到】 : 你用c++能比人家c的快么? : 要不要问问好虫同意不同意?
|
z*******3 发帖数: 13709 | 65 read this
old man
Why Renjin?
We built Renjin, a new interpreter for the JVM because we wanted the beauty,
the flexibility, and power of R with the performance of the Java Virtual
Machine.
Bigger data
R has been traditionally limited by the need to fit data sets into memory,
and working with even modest sets of data can quickly exhaust memory due to
historical limitations in GNU R interpreter’s implementation.
Renjin will allow R scripts to transparently interact with data wherever it
’s stored, whether that’s on disk, in a remote database, or in the cloud.
While there have been attempts to bring big data to the original interpreter
, these have generally provided a parallel set of data structures and
algorithms, threatening a fragmentation of the language and platform. Renjin
, in contrast, will allow existing R code to run on larger datasets with no
modification, using R’s familiar and standard data structures and
algorithms.
Better performance
Renjin offers performance improvements in executing R code on several fronts:
Vector operations: Renjin’s deferred computation engine automatically
parallelizes and optimizes vector operation to run an order of magnitude
faster, without the memory demands of computing intermediate structures
Matrix operations: Renjin allows the user to plugin best-of-class
implementations of BLAS, LAPACK, and FFT.
Scalar operations: Renjin will compile frequently used portions of R code to
JVM byte code on the fly, dramatically increasing performance of R’s
notorious performance on for loops and other predominantly scalar code [
2013Q3]
These improvements make it possible to perform real-time analyses using
complex models.
Cloud-ready
Renjin enables R developers to deploy their code to Platform-as-a-Service
providers like Google Appengine, Amazon Beanstalk or Heroku without worrying
about scale or infrastructure. Renjin is pure Java - it can run anywhere.
You can try the live demo of the interpreter on Google Appengine to see
Renjin in action.
Seamless integration with the rest of the enterprise
Built on the JVM, Renjin allows R code to interact directly with JVM
libraries and data structures, without the need for expensive data transfer
or brittle inter-process communication.
Java and Scala developers can expose their data directly to R scripts by
implementing a simple interface. To the R developer, the data looks no
different than a normal R data structure.
Renjin runs safely in multithreaded application servers, allowing embedders
to create as many independent “apartments” to run existing single-threaded
R code, or to allow multi- threaded access if the user’s R code is written
in a pure, functional manner. Renjin allows developers to choose the right
language for the different components of an enterprise system, without
worrying how they’ll interact.
More productive development cycle
Many enterprises will prototype analyses and models in R because of it’s
ease of use, but then port the results to Java/C++ for production use,
either because of performance limitations or due to poor interoperability
between the original R VM and other enterprise systems.
With Renjin, analysts can move directly from prototype to production. R
scripts can be packaged as JARs and called directly from JVM-based
environments and referenced directly by other JVM languages like Java, Scala
, JRuby, or Clojure.
Open-source and cutting-edge
Like R itself, the Renjin source code is available under an open-source
license. That means you get to stand on the shoulders of giants at little or
no cost.
Support
Check out the support page if you need (commercial) support for Renjin.
【在 l*********s 的大作中提到】 : 差不多就行了,java先得干翻了c++才有资格挑战c。
|
l*********s 发帖数: 5409 | 66 well, it is against common sense, so it needs to be verified. and the fact
that I am willing to be bothered says enough about my open mindedness :-)
beauty,
to
【在 z*******3 的大作中提到】 : read this : old man : Why Renjin? : We built Renjin, a new interpreter for the JVM because we wanted the beauty, : the flexibility, and power of R with the performance of the Java Virtual : Machine. : Bigger data : R has been traditionally limited by the need to fit data sets into memory, : and working with even modest sets of data can quickly exhaust memory due to : historical limitations in GNU R interpreter’s implementation.
|
t****t 发帖数: 6806 | 67 语言可能差别不大, 但是matlab的toolbox没人能比
说matlab在企业里用得不多的, 显然不是干这一行的.
别的行业不说, 我做通信和信号处理的. 做信号处理的你说不会用matlab人家都觉得你
有毛病. 看看IEEE的standard, 里面直接有matlab code.
当然具体到某一个toolbox, 很有可能有别的工具比它强. 但是综合起来仍然是工具最多
的.
【在 i***r 的大作中提到】 : 我对R 不是很熟。 : 如果只说一个的话,我觉得是 : R is designed for STATISTICAL analysis, while : Matlab is designed for NUMERICAL analysis : 请指教
|
t*h 发帖数: 1629 | 68 matlab的toolbox都是牛人带头反复测试的东西。
R是opensource,测试可能还没那么全。
【在 i***r 的大作中提到】 : 我对R 不是很熟。 : 如果只说一个的话,我觉得是 : R is designed for STATISTICAL analysis, while : Matlab is designed for NUMERICAL analysis : 请指教
|
c****t 发帖数: 19049 | 69 赵老师说的太高深看不懂。去renjin网站上转了一圈好像就是说要把R弄到前端嘛。据
说用时减半?这个真心没用。赵老师知道传统统计,Bayesian统计,machine learning
,time-series和mathematical programming计算最heavy的地方都是哪些么?过去是都
用FORTRAN/C加速。说实话对现在的数据量不够。除了Bayesian,现在的方向都是用硬件
加速。Bayesian基本上没法用并行加速,工业界用不上。最后硬件发达了估计会倒退回
去算数值积分嘿嘿
r目前能用的packages背后都是FORTRAN,C。算法都是没法并行的传统优化。看不出弄到
JVM上有啥帮助。
matlab在工业界没啥影响力。过去Excel不行的时候做finance的把matlab当个大的
spreadsheet用 |
z*******3 发帖数: 13709 | 70 换一种方式跟你说
前端是给脚本去做的
jvm不负责前端,也就是jvm很多时候
不负责网页的处理,而负责复杂的逻辑计算
那现在这里有一个问题
企业内部都是jvm,但是呢,java本身,是一个比较专业的东西
一般非科班出身,或者即便是科班出身,阴差阳错,错过这个领域的也很多
很多搞mobile去了,更不要说搞统计等外行了
所以一般程序员用java或者scala这些,总之最后上一个jvm没有问题
但是,但是,但是,搞data scientists的人,压根不会java
多数只懂r这些,而r本身的引擎,跟jvm是两个世界,当然可以通过接口连起来
但是这样效率其实还是不行,分层的效率偏低
所以统计和程序员之间,有一个很大的gap,最理想的就是让data scientists去搞r
程序员去写java/scala这些,不需要做任何改动,就能无缝集成起来
这是最理想的,那现在renjin就在做这个事情
工业界需求很大,尤其是统计应用比较广泛的领域,比如保险公司,药厂
硬件加速在backend不是问题,随便一台server,经常是计算资源用不完
十年前就这样了,现在it很少有拼命算那点资源过日子的,现在只有mobile还是这样
其他的,包括pc,都已经过剩了
learning
【在 c****t 的大作中提到】 : 赵老师说的太高深看不懂。去renjin网站上转了一圈好像就是说要把R弄到前端嘛。据 : 说用时减半?这个真心没用。赵老师知道传统统计,Bayesian统计,machine learning : ,time-series和mathematical programming计算最heavy的地方都是哪些么?过去是都 : 用FORTRAN/C加速。说实话对现在的数据量不够。除了Bayesian,现在的方向都是用硬件 : 加速。Bayesian基本上没法用并行加速,工业界用不上。最后硬件发达了估计会倒退回 : 去算数值积分嘿嘿 : r目前能用的packages背后都是FORTRAN,C。算法都是没法并行的传统优化。看不出弄到 : JVM上有啥帮助。 : matlab在工业界没啥影响力。过去Excel不行的时候做finance的把matlab当个大的 : spreadsheet用
|
|
|
z*******3 发帖数: 13709 | 71 jvm比fortran快
你不要小看lars bak的水平
话说跨平台,搞byte code这些,最早实现就是fortran干的
最早是把fortran编译成byte code,然后跨平台,只是当时机器性能太差
作罢,后来被java抄过去而已,不是java的独创,java很多东西都是踩在前人的肩膀上的
也不是离得很远,分布式现在企业内部计算资源过剩,pc和server是两个概念
server强大得多
learning
【在 c****t 的大作中提到】 : 赵老师说的太高深看不懂。去renjin网站上转了一圈好像就是说要把R弄到前端嘛。据 : 说用时减半?这个真心没用。赵老师知道传统统计,Bayesian统计,machine learning : ,time-series和mathematical programming计算最heavy的地方都是哪些么?过去是都 : 用FORTRAN/C加速。说实话对现在的数据量不够。除了Bayesian,现在的方向都是用硬件 : 加速。Bayesian基本上没法用并行加速,工业界用不上。最后硬件发达了估计会倒退回 : 去算数值积分嘿嘿 : r目前能用的packages背后都是FORTRAN,C。算法都是没法并行的传统优化。看不出弄到 : JVM上有啥帮助。 : matlab在工业界没啥影响力。过去Excel不行的时候做finance的把matlab当个大的 : spreadsheet用
|
z*******3 发帖数: 13709 | 72 java脚本引擎最大的意义就在于让写脚本的其他人
不管是写web的还是统计的,都能真正参与到企业运作中去
而不是通过一种很怪异的方式衔接起来 |
z*******3 发帖数: 13709 | 73 统计其实不是什么computation heavy的地方
主要麻烦的是各种模型,模型搞定之后
很多时候就是数数的问题,打散,最常见的就是用mr扔过去
然后就是等等就好了,用r也不是因为r多powerful
而是因为r上模型多,轮子多,拿来就能用
贪图的不就是这么一个省事么? |
c****t 发帖数: 19049 | 74 哦这回看懂了就是说做IT的要一统天下。嘿嘿坚决打击这个,因为。。。因为我们做
analytics也想police everybody呀。。。
statcompute刘老师早就教育大家了(忘了是不是在这个版上),很多模型r现在的
packages都没有。赵老师是有个统计学位?好像不那么给力啊
想省事就要被IT的管一道啊。我们的理想是把搞IT的全踢出executive teams嘿嘿
【在 z*******3 的大作中提到】 : 统计其实不是什么computation heavy的地方 : 主要麻烦的是各种模型,模型搞定之后 : 很多时候就是数数的问题,打散,最常见的就是用mr扔过去 : 然后就是等等就好了,用r也不是因为r多powerful : 而是因为r上模型多,轮子多,拿来就能用 : 贪图的不就是这么一个省事么?
|
z*******3 发帖数: 13709 | 75 it的不可能去做data scientists的活的
因为没有学过r那些model,你给了也没用啊
r脚本是给统计用的
简单说不是谁抢了谁的工作
而是这两个专业共生得更好一点
把效率给提上来
【在 c****t 的大作中提到】 : 哦这回看懂了就是说做IT的要一统天下。嘿嘿坚决打击这个,因为。。。因为我们做 : analytics也想police everybody呀。。。 : statcompute刘老师早就教育大家了(忘了是不是在这个版上),很多模型r现在的 : packages都没有。赵老师是有个统计学位?好像不那么给力啊 : 想省事就要被IT的管一道啊。我们的理想是把搞IT的全踢出executive teams嘿嘿
|
z*******3 发帖数: 13709 | 76 r有没有不重要,cutting edge的东西
很多时候工业界不用的,所以关注的是
哪些东西用得更多,实在是需要实现了
再说,所以你应该看看精算他们在干嘛
精算是统计应用最为广泛得一个学科了
精算的那些模型,基本上r都有
所以抢的是这些东西,而且不管怎样社区大
r肯定都会有一些没有的东西,最新的成果要转换成生产力,需要时间
但是不代表现有的很早以前就转换出来的东西不能用
it自己都很少用一些很新的产品
【在 c****t 的大作中提到】 : 哦这回看懂了就是说做IT的要一统天下。嘿嘿坚决打击这个,因为。。。因为我们做 : analytics也想police everybody呀。。。 : statcompute刘老师早就教育大家了(忘了是不是在这个版上),很多模型r现在的 : packages都没有。赵老师是有个统计学位?好像不那么给力啊 : 想省事就要被IT的管一道啊。我们的理想是把搞IT的全踢出executive teams嘿嘿
|
z*******3 发帖数: 13709 | 77 就是统计的去用r,it的用java那些
现在要用r效率低是一回事,r引擎还是单线程的,fp可以通过多线程优化的
主要还是接口很烦,所以给了sas以生存的空间
但是renjin出来以后,这个局面会改观
r有广泛的群众基础,这个很重要 |
c****t 发帖数: 19049 | 78 趴了。赵老师您认识StatsGuy? 没理由两个不同的人扯的差不多啊
【在 z*******3 的大作中提到】 : r有没有不重要,cutting edge的东西 : 很多时候工业界不用的,所以关注的是 : 哪些东西用得更多,实在是需要实现了 : 再说,所以你应该看看精算他们在干嘛 : 精算是统计应用最为广泛得一个学科了 : 精算的那些模型,基本上r都有 : 所以抢的是这些东西,而且不管怎样社区大 : r肯定都会有一些没有的东西,最新的成果要转换成生产力,需要时间 : 但是不代表现有的很早以前就转换出来的东西不能用 : it自己都很少用一些很新的产品
|
z*******3 发帖数: 13709 | 79 不认识啊
有些东西是共识很奇怪么?
现在这一块大发展啊
要顺应潮流
我觉得那个cocoa2005大概能看懂我在说啥
【在 c****t 的大作中提到】 : 趴了。赵老师您认识StatsGuy? 没理由两个不同的人扯的差不多啊
|
z*******3 发帖数: 13709 | 80 不要过于苛求工具
工具本身进步需要时间
有多少就用多少
这个没有办法
因为工具不完美就不用
那这就是因噎废食
renjin现在还比较弱
但是现在弱并不代表以后也弱啊
慢慢会好的
主要是这个东西便宜,开源,不收你钱
这个很重要啊,呵呵
matlab和sas都是收费的
【在 c****t 的大作中提到】 : 趴了。赵老师您认识StatsGuy? 没理由两个不同的人扯的差不多啊
|
|
|
c****t 发帖数: 19049 | 81 泪,不是共识啊赵老师。不靠边啊
【在 z*******3 的大作中提到】 : 不认识啊 : 有些东西是共识很奇怪么? : 现在这一块大发展啊 : 要顺应潮流 : 我觉得那个cocoa2005大概能看懂我在说啥
|
z*******3 发帖数: 13709 | 82 我倒,那我不知道别人说啥
【在 c****t 的大作中提到】 : 泪,不是共识啊赵老师。不靠边啊
|
c****t 发帖数: 19049 | 83 当然不用matlab和sas啦
工具弱当然也得用。小孩们又不懂最新的东东。不过现成的东东没法成明天的主流啊
renjin是肯定不用的。弄这玩意还要雇个码工admin/maintain。多买几个GPU账面上还
可以depreciation便宜多了
littlebirds老师觉得奇怪我倒不觉得。java近几年快了不少,不少没啥大用的
numerical测试都显试java/C++也就是个2.0,当然还比不上C。如果java这边用了blas,
lapack或intel那个专门做弊的mxl而另一边C/C++没用,那java这边快也不奇怪。不过
对于现在的modeling,这都没用。
【在 z*******3 的大作中提到】 : 不要过于苛求工具 : 工具本身进步需要时间 : 有多少就用多少 : 这个没有办法 : 因为工具不完美就不用 : 那这就是因噎废食 : renjin现在还比较弱 : 但是现在弱并不代表以后也弱啊 : 慢慢会好的 : 主要是这个东西便宜,开源,不收你钱
|
z*******3 发帖数: 13709 | 84 没有让统计的人去用java
他们还是用r
剩下的交给renjin和it去搞定
模型跟java无关,但是跟r关系很大
blas,
【在 c****t 的大作中提到】 : 当然不用matlab和sas啦 : 工具弱当然也得用。小孩们又不懂最新的东东。不过现成的东东没法成明天的主流啊 : renjin是肯定不用的。弄这玩意还要雇个码工admin/maintain。多买几个GPU账面上还 : 可以depreciation便宜多了 : littlebirds老师觉得奇怪我倒不觉得。java近几年快了不少,不少没啥大用的 : numerical测试都显试java/C++也就是个2.0,当然还比不上C。如果java这边用了blas, : lapack或intel那个专门做弊的mxl而另一边C/C++没用,那java这边快也不奇怪。不过 : 对于现在的modeling,这都没用。
|
c****t 发帖数: 19049 | 85 晓得啊。是说您这个renjin的加速没啥用。。。
【在 z*******3 的大作中提到】 : 没有让统计的人去用java : 他们还是用r : 剩下的交给renjin和it去搞定 : 模型跟java无关,但是跟r关系很大 : : blas,
|
z*******3 发帖数: 13709 | 86 你们不用jvm,形形色色的企业用得可多了
保险集团有很大的需求,一般保险公司肯定有it
所以不需要额外雇人做
【在 c****t 的大作中提到】 : 晓得啊。是说您这个renjin的加速没啥用。。。
|
c****t 发帖数: 19049 | 87 hoho~ 赵老师没看我回您的另一贴。保险大点的公司都在从legacy往jvm上转。那一行
卖platform最大的三家vendors卖的都是jvm的。不过保险这行里大都不懂什么modeling
。银行业里有statcompute刘老师这水平的也凤毛麟角。这都不重要,重要的是要把
modeling推到前端这速度实在不够看。再提10倍还可以商量
【在 z*******3 的大作中提到】 : 你们不用jvm,形形色色的企业用得可多了 : 保险集团有很大的需求,一般保险公司肯定有it : 所以不需要额外雇人做
|
n******7 发帖数: 12463 | 88 最后一句啥意思
速度不重要?
blas,
【在 c****t 的大作中提到】 : 当然不用matlab和sas啦 : 工具弱当然也得用。小孩们又不懂最新的东东。不过现成的东东没法成明天的主流啊 : renjin是肯定不用的。弄这玩意还要雇个码工admin/maintain。多买几个GPU账面上还 : 可以depreciation便宜多了 : littlebirds老师觉得奇怪我倒不觉得。java近几年快了不少,不少没啥大用的 : numerical测试都显试java/C++也就是个2.0,当然还比不上C。如果java这边用了blas, : lapack或intel那个专门做弊的mxl而另一边C/C++没用,那java这边快也不奇怪。不过 : 对于现在的modeling,这都没用。
|
c****t 发帖数: 19049 | 89 速度很重要的说。。。renjin速度很不够的说。。。
【在 n******7 的大作中提到】 : 最后一句啥意思 : 速度不重要? : : blas,
|
n******7 发帖数: 12463 | 90 还是不明白renjin有啥用处
我感觉这玩意最后就跟jython差不多
能让r-base跑jvm上,但是很多package不能用
比如用jython不能用numpy,这就鸡肋了
【在 z*******3 的大作中提到】 : 不要过于苛求工具 : 工具本身进步需要时间 : 有多少就用多少 : 这个没有办法 : 因为工具不完美就不用 : 那这就是因噎废食 : renjin现在还比较弱 : 但是现在弱并不代表以后也弱啊 : 慢慢会好的 : 主要是这个东西便宜,开源,不收你钱
|
|
|
n******7 发帖数: 12463 | 91 这也是我不明白的
R计算量大的部分好多都是C/fortran写的
换成renjin真的会快?
【在 c****t 的大作中提到】 : 速度很重要的说。。。renjin速度很不够的说。。。
|
z*******3 发帖数: 13709 | 92 如果真的要这样算的话
那雇用搞统计的人的地方真心坑不是很多
药厂算一个?
药厂我估计也多少会用到点jvm
不过没混过,不知道
精算那些算不算modeling?
这推到前端干什么?直接在后端做一个function
领导什么时候想看,直接点一下就好了
比自己吭哧吭哧定期出报表强很多
modeling
【在 c****t 的大作中提到】 : hoho~ 赵老师没看我回您的另一贴。保险大点的公司都在从legacy往jvm上转。那一行 : 卖platform最大的三家vendors卖的都是jvm的。不过保险这行里大都不懂什么modeling : 。银行业里有statcompute刘老师这水平的也凤毛麟角。这都不重要,重要的是要把 : modeling推到前端这速度实在不够看。再提10倍还可以商量
|
c****t 发帖数: 19049 | 93 现在有个公司revolution analytics就这思路。把r-base重写到.net上。刚出来时统计
版上吵了一通。去年这家终于开窍弄mxl了,弄了假parallel,价钱涨了10倍。r-base
提速不错,其它没compile的减时10%~30%
【在 n******7 的大作中提到】 : 还是不明白renjin有啥用处 : 我感觉这玩意最后就跟jython差不多 : 能让r-base跑jvm上,但是很多package不能用 : 比如用jython不能用numpy,这就鸡肋了
|
z*******3 发帖数: 13709 | 94 http://acs.lbl.gov/software/colt/
可以用这个
关键是是r的社区很活跃
能直接不用重写代码就移植是最理想的
当然这个最后需要看pkg支持的数量
罗马也不是一夜之间建成的
需要时间,现在还不成熟
【在 n******7 的大作中提到】 : 还是不明白renjin有啥用处 : 我感觉这玩意最后就跟jython差不多 : 能让r-base跑jvm上,但是很多package不能用 : 比如用jython不能用numpy,这就鸡肋了
|
z*******3 发帖数: 13709 | 95 所以最后要试试才知道
从它给的报告上说是更快
【在 n******7 的大作中提到】 : 这也是我不明白的 : R计算量大的部分好多都是C/fortran写的 : 换成renjin真的会快?
|
z*******3 发帖数: 13709 | 96 没有关系
我们开源的不搞骗钱这一套
想赚钱就不开源了
base
【在 c****t 的大作中提到】 : 现在有个公司revolution analytics就这思路。把r-base重写到.net上。刚出来时统计 : 版上吵了一通。去年这家终于开窍弄mxl了,弄了假parallel,价钱涨了10倍。r-base : 提速不错,其它没compile的减时10%~30%
|
c****t 发帖数: 19049 | 97 药厂不懂,知道的几个主平台还都是legacy。jvm有,没当做主平台, 都是integrated
保险搞modeling都另有部门。可能是精算可能不是,各公司不同。也有能人,只是平均
水平没法跟hi-tech,marketing什么的比罢了
前端用modeling没看出有啥benefits。任何行业做modeling最重要都的是把工作解释给
一帮business people听。想推到前端,business partners们sign off你结果吗
【在 z*******3 的大作中提到】 : 如果真的要这样算的话 : 那雇用搞统计的人的地方真心坑不是很多 : 药厂算一个? : 药厂我估计也多少会用到点jvm : 不过没混过,不知道 : 精算那些算不算modeling? : 这推到前端干什么?直接在后端做一个function : 领导什么时候想看,直接点一下就好了 : 比自己吭哧吭哧定期出报表强很多 :
|
z*******3 发帖数: 13709 | 98 感情jvm对你们算是前端了
integration有很多种方式,我还是信不过r的engine
试试才知道,单线程的优化渠道受限
所以我相信快应该是有道理的
至于business people
解释一个很重要的方式是图像图表以及自动化处理
没什么批不批的,有东西就用,工具多了没什么不好的
至少选择多了
integrated
【在 c****t 的大作中提到】 : 药厂不懂,知道的几个主平台还都是legacy。jvm有,没当做主平台, 都是integrated : 保险搞modeling都另有部门。可能是精算可能不是,各公司不同。也有能人,只是平均 : 水平没法跟hi-tech,marketing什么的比罢了 : 前端用modeling没看出有啥benefits。任何行业做modeling最重要都的是把工作解释给 : 一帮business people听。想推到前端,business partners们sign off你结果吗
|
z*******3 发帖数: 13709 | 99 modeling跟具体的impl没有什么关系
做出了model,领导们想看,随时点个按钮就能看到
这个就需要折腾jvm去了,另外就是r是fp和单线程的东东
很多东东理论上是可以通过多线程来优化效率的
我买这张账,但是到底行不行,试了才知道
至少我觉得理论上没啥问题,等1.0出来之后我试试
integrated
【在 c****t 的大作中提到】 : 药厂不懂,知道的几个主平台还都是legacy。jvm有,没当做主平台, 都是integrated : 保险搞modeling都另有部门。可能是精算可能不是,各公司不同。也有能人,只是平均 : 水平没法跟hi-tech,marketing什么的比罢了 : 前端用modeling没看出有啥benefits。任何行业做modeling最重要都的是把工作解释给 : 一帮business people听。想推到前端,business partners们sign off你结果吗
|
n******7 发帖数: 12463 | 100 这两天学java,刚看了这个库
renjin关键是能有多少人玩
这种移植型的project,总是要跟在原生project后面搞
没几个人玩的话,就没什么吸引力
干活的时候缺一个我要的包的话,我总不能为了用renjin,先自己移植一遍吧
【在 z*******3 的大作中提到】 : http://acs.lbl.gov/software/colt/ : 可以用这个 : 关键是是r的社区很活跃 : 能直接不用重写代码就移植是最理想的 : 当然这个最后需要看pkg支持的数量 : 罗马也不是一夜之间建成的 : 需要时间,现在还不成熟
|
|
|
z*******3 发帖数: 13709 | 101 现在搞这个还太早,还是搞其他的库合适
这个还远没到成熟的地步
renjin最重要的不是多少人玩
而是能impl多少r的pkg
也就是离不需要修改r脚本就能跑还有多远
现在还不适合下放生产
【在 n******7 的大作中提到】 : 这两天学java,刚看了这个库 : renjin关键是能有多少人玩 : 这种移植型的project,总是要跟在原生project后面搞 : 没几个人玩的话,就没什么吸引力 : 干活的时候缺一个我要的包的话,我总不能为了用renjin,先自己移植一遍吧
|
z*******3 发帖数: 13709 | 102 学java的话,脚本引擎是相对高级的技巧
跟jruby这些类似,学习java还是先把重心放在java本身上
就是jruby这些也远比renjin成熟
jruby东京大学做了快10年了,成熟太多了
【在 n******7 的大作中提到】 : 这两天学java,刚看了这个库 : renjin关键是能有多少人玩 : 这种移植型的project,总是要跟在原生project后面搞 : 没几个人玩的话,就没什么吸引力 : 干活的时候缺一个我要的包的话,我总不能为了用renjin,先自己移植一遍吧
|
z*******3 发帖数: 13709 | 103 总之现在弄renjin还太早
各种东东说了也没法验证
等renjin出来之后再看
如果它说得不如它做得
那这个也有问题,如果反过来
为什么不?免费工具多一个总是好的 |
n******7 发帖数: 12463 | 104 玩的人多移植的包才多啊
没人玩的也没人有兴趣contribute
我说的是colt,做计算的那个库,我想试试看用java算东西能有多块
【在 z*******3 的大作中提到】 : 现在搞这个还太早,还是搞其他的库合适 : 这个还远没到成熟的地步 : renjin最重要的不是多少人玩 : 而是能impl多少r的pkg : 也就是离不需要修改r脚本就能跑还有多远 : 现在还不适合下放生产
|
z*******3 发帖数: 13709 | 105 java的快优势主要是通过git来实现的
你跟python比就可以感觉出来
尤其是跟python写的代码比
跟python的lib,有些是c写的,未必会快
【在 n******7 的大作中提到】 : 玩的人多移植的包才多啊 : 没人玩的也没人有兴趣contribute : 我说的是colt,做计算的那个库,我想试试看用java算东西能有多块
|
n******7 发帖数: 12463 | 106 你想说jit吧
我是准备在project中实际用java +jblas 之类跟 python+numpy比比看
【在 z*******3 的大作中提到】 : java的快优势主要是通过git来实现的 : 你跟python比就可以感觉出来 : 尤其是跟python写的代码比 : 跟python的lib,有些是c写的,未必会快
|
c****t 发帖数: 19049 | 107 python嘛看看anaconda和它的accelerator。至少那是搞计算的熟习的路子
jvm神马的对我们当然是前端了,凡是进production environment的都是前端。model做
好了交给码工cache去。所谓的动态不过都是BI,现有技术实在不能让人real-time更新
model。做modeling的去care UI那才奇了。。。
【在 z*******3 的大作中提到】 : java的快优势主要是通过git来实现的 : 你跟python比就可以感觉出来 : 尤其是跟python写的代码比 : 跟python的lib,有些是c写的,未必会快
|
z*******3 发帖数: 13709 | 108 对哦,最近github用多了,概念容易错位
不过你这样是比较lib/pkg的效率
【在 n******7 的大作中提到】 : 你想说jit吧 : 我是准备在project中实际用java +jblas 之类跟 python+numpy比比看
|
z*******3 发帖数: 13709 | 109 你这里面的关键一步
“model做好了交给码工cache去。”
renjin就可以直接做了,renjin主要是优化这一步
gui其实挺重要,palantir的一个招牌feature就是这个
但是搞起来太费神
【在 c****t 的大作中提到】 : python嘛看看anaconda和它的accelerator。至少那是搞计算的熟习的路子 : jvm神马的对我们当然是前端了,凡是进production environment的都是前端。model做 : 好了交给码工cache去。所谓的动态不过都是BI,现有技术实在不能让人real-time更新 : model。做modeling的去care UI那才奇了。。。
|
c****t 发帖数: 19049 | 110 免费的不行嘿嘿。要做活要用IMSL变的JMSL
【在 n******7 的大作中提到】 : 你想说jit吧 : 我是准备在project中实际用java +jblas 之类跟 python+numpy比比看
|
|
|
n******7 发帖数: 12463 | 111 当然也有点自己的java python code
但是有轮子的时候,总不能自己造轮子吧
【在 z*******3 的大作中提到】 : 对哦,最近github用多了,概念容易错位 : 不过你这样是比较lib/pkg的效率
|
c****t 发帖数: 19049 | 112 这一步不值什么钱的说。。。
【在 z*******3 的大作中提到】 : 你这里面的关键一步 : “model做好了交给码工cache去。” : renjin就可以直接做了,renjin主要是优化这一步 : gui其实挺重要,palantir的一个招牌feature就是这个 : 但是搞起来太费神
|
z*******3 发帖数: 13709 | 113 不值钱,但是会有大量工作在这里面
烦啊,而且人家不要钱
这样就可以关注在想要关注的东西上
没事不要在这种东西上费神
不碰硬件也差不多是这个道理
【在 c****t 的大作中提到】 : 这一步不值什么钱的说。。。
|
z*******3 发帖数: 13709 | 114 而且可以冲击一下你给出的jsml这种商品
不用钱的总是好的
【在 c****t 的大作中提到】 : 这一步不值什么钱的说。。。
|
n******7 发帖数: 12463 | 115 屌丝就用免费的先撑着,老板又不给钱买
反正算的东西也不是太大,最多几天
自己各种东西熟悉了就够本了,我一边干一边学
不过收费的是好啊,看了一眼你说的anaconda,有GPU加速和MKL优化,应该快不少
【在 c****t 的大作中提到】 : 免费的不行嘿嘿。要做活要用IMSL变的JMSL
|
z*******3 发帖数: 13709 | 116 是啊
免费午餐吃了,就不要太挑剔不好吃了
毕竟是免费的
如果愿意花钱的话
用嘴巴编程就好了
【在 n******7 的大作中提到】 : 屌丝就用免费的先撑着,老板又不给钱买 : 反正算的东西也不是太大,最多几天 : 自己各种东西熟悉了就够本了,我一边干一边学 : 不过收费的是好啊,看了一眼你说的anaconda,有GPU加速和MKL优化,应该快不少
|