将一个六位数的数字列拆分为分隔的列,保留一位数的 []

如何使用 pandas 或 numpy 将一列 6 个整数数字分成 6 列,每列 1 个数字? 进口熊猫作为 pd 将 numpy 导入为 np Df = pd 系列 (范围 (123456,123465) 数据框 (df) 头 () 我所拥有的就像下面这个 号码 654321 223344 期望的结果应该如下所示。 号码 | x1 | x2 | x3 | x4 | x5 | x6 | 654321 | 6 | 5 | 4 | 3 | 2 | 1 | 223344 | 2 | 3 | 4 | ……

共8个回答, 标签: python pandas numpy
Numpy 1D 数组: 重复超过 n 次的屏蔽元素

给定一个整数数组 【 1 、 2 、 3 、 4 、 5 】 我需要屏蔽重复次数超过的元素N时代。要澄清:主要目标是检索布尔屏蔽数组,稍后将其用于分级计算。 我想出了一个相当复杂的解决方案 将 numpy 作为 np 导入 垃圾箱 = np。阵列 ([1 、 2 、 3 、 4 、 5 、 5]) N = 3 Splits = np.split (垃圾箱,np.where (np.diff (垃圾箱)!= 0) [0] 1) 面具 = [] 对于拆分中的 s: 如果 s.shape [0] <= N: Mask.append (np.ones (s.shape [0]).astype (np.bool _)) 其他: Mask.append (np.One (N),np.Zero (s.shape [0]-N))。astype (np.bool _)) Mask = np.concatenate (mask) 给予例如 垃圾箱 [面具] Out [90]: array ([1 、 2 、 3 、 4 、 5]) 有没有更好的方法来做到这一点? 编辑,#2: 非常感谢您的回答!这是 ……

共8个回答, 标签: python arrays numpy binning
在 numpy [复制] 中快速找到对称对

这个问题已经有了答案: 如何在数据框中删除值顺序不重要的行 [/questions/50975798/how-remove-rows-in-a-dataframe-that-the-order-of-values-are-not-important] (2 个答案) 从迭代工具导入产品 进口熊猫作为 pd Df = pd.DataFrame.From _ records (产品 (范围 (10),范围 (10) Df = df.sample (90) Df.columns = "c1 c2".split () Df = df.sort_values (df.columns.tolist ()).reset_index (drop = True) # C1 c2 #0 #1 0 1 #2 0 2 #3 0 3 #4 0 4 #. #85 9 4 #86 9 5 #87 9 7 #88 9 8 #89 9 9 # #[90 行 x 2 列] 如何快速找到并删除此数据帧中所有对称对的最后一个副本? 对称对我的意思是(0, 1) is equal to (1, 0)。后者应该被移除。 它需要快速,所以 ……

共6个回答,已解决, 标签: python pandas numpy
根据给定条件过滤数据框并添加新列

我有一个这样的数据框 ID col1 col2 Abc 街 1 号 2017-07-27 1 无 2017-08-17 2018-07-15 Def 街 1 号 1 无 2018-08-13 月 fbg 街 2018-01-07 2 无 2018-08-12 2019-01-15 号 trf 街 2 号 我想过滤 col1 中的所有 “无”,并将相应的 col2 值添加到新的列 col3 中。我的输出是这样的 ID col1 col2 col3 1 Abc 街 2017-07-27 2017-08-17 1 Def 街 2018-07-15 2018-08-13 月 fbg 街 2018-01-07 2018-08-12 2019-01-15 号 trf 街 2 号 有人能帮我实现这个目标吗? ……

共5个回答, 标签: python python-3.x pandas numpy pandas-groupby
将索引列表转换为 2D numpy 数组的最快方法

我有一个指数列表 A = [ [1,2,4], [0,2,3], [1,2,4], 【 0,2 】】 将其转换为 numpy 数组的最快方法是什么,其中每个索引显示 1 将出现的位置? 我想要的是: 输出 = 数组 ([ 【 0,1,1,0,1 】, [1,0,1,1,0], 【 0,1,0,1,1 】, 【 1,0,1,0,0 】】) 我事先知道数组的最大大小。我知道我可以遍历每个列表,并在每个索引位置插入 1,但是有没有更快/向量化的方法来做到这一点? 我的用例可能有成千上万行/cols,我需要做成千上万次,所以越快越好。 ……

共5个回答,已解决, 标签: python arrays performance numpy
使用列名称重塑长到宽

嗨,我在重塑我的 df 时遇到了困难。 我有: Netflix 电视 DVD 0.1 0.2 0.3 0.12 0.5 0.15 0.4 0.6 0.8 0.5 0.41 0.41 0.2 我想把我的 df 转换成: 网飞 [0.1,0.12,0.4] 电视 [0.2,0.5,0.6,0.5,0.41,0.2] DVD 【 0.3 、 0.15 、 0.8 、 0.41 】 不知道如何堆栈 ()或者旋转 ()会在这种 df 上工作。感谢任何帮助。 ……

共5个回答,已解决, 标签: python pandas numpy reshape
Python 中的 &ldquo;板 [x,y&rdquo; 和 &ldquo;板 [x [y&rdquo; 有区别吗?

我正在通过一个教程 GeekforGeeks 网站 [https://www.geeksforgeeks.org/python-implementation-automatic-tic-tac-toe-game-using-random-number/] 又注意到他们的检查程序的各种使用board[x,y]这是我以前从未见过的我认为这样做不起作用,但是当我运行这个程序时,一切都如预期的那样进行。 我尝试使用上面概述的方法和我更熟悉的方法运行一个较小的代码示例 (board[x][y]), but when I run my code, I get TypeError: list indices must be integers or slices, not tuple 我的代码: 板 = [[1,1,1],[1,2,2],[1,2,2]] Win = 'true' 如果板 [1] = = 2: Win = '按正常标准' 打印 (win) 如果板 [1,2] = 2: Win = '以奇怪的标准来说是真的' 打印 (win) 打印 (win) 他们的代码: Def row _ win (板, ……

共5个回答,已解决, 标签: python arrays list numpy indexing
按连续索引号分组

我想知道是否有办法按连续索引号分组,并在不同的列中移动组。这是我正在使用的数据框的一个例子: 0 0 19218.965703 19247.621650 2 19232.651322 9 19279.216956 10 19330.087371 11 19304.316973 我的想法是通过顺序索引号来查找,得到这样的结果: 0 1 0 19218.965703 19279.216956 1 19247.621650 19330.087371 2 19232.651322 19304.316973 我一直试图将我的数据分成 3 个块,然后分组,但是我正在寻找更多可以用来分组和重新排列顺序索引号的东西。谢谢! ……

共4个回答,已解决, 标签: python pandas numpy group-by
Numpy.median.reduceat 的快速替代方案

与这个答案 [https://stackoverflow.com/a/51029521/2431885],有没有一种快速的方法来计算数组中的中位数不平等 元素的数量? E.g.: 数据 = [1.00,1.05,1.30,1.20,1.06,1.54,1.33,1.87,1.67,.] 指数 = [0,0,1,1,1,2,3,3,..] 然后我想计算每个组的数字和中位数之间的差异 (例如组的中位数0 is 1.025 so the first result is 1.00 - 1.025 = -0.025)。因此,对于上面的数组,结果将显示为: 结果 = [-0.025,0.025,0.05,-0.05,-0.19,0.29,0.00,0.10,-0.10,.] 自np.median.reduceat不存在 (还),有没有另一种快速的方法来实现这一点?我的阵列将包含数百万行,所以速度至关重要! 索引可以被认为是连续的和有序的 (如果它们不是,很容易转换它们)。 ----------------------------------------------------------------- ……

共4个回答,已解决, 标签: python performance numpy median numpy-ufunc
用 python 替代重复 np.vstack 的有效方法?

我试图实现这一点帖子 [https://math.stackexchange.com/questions/3241401/is-there-an-academic-name-for-this-one-polyline-shape/3242064#3242064] 用 python。 将 numpy 导入为 np 数组 ([0,0,0]) 范围 (3) 内的 r: X = np.vstack ((x,np.数组 ([-r,r,-r) X获取此值 数组 (【 0,0,0 】, 【 0,0,0 】, [-1,1,-1], 【-2 、-2 】】) 我担心重复的运行时效率Np.vstack。有没有更有效的方法来做到这一点? ……

共3个回答, 标签: python numpy
获取 numpy 阵列值的矩阵图像-内部具有像素值的网格 (而不是颜色)

这个赏金 [https://stackoverflow.com/help/bounty]已经结束。这个问题的答案有资格获得 100 的声誉奖金。赏金宽限期在 17 小时内结束。Lbragile [/users/4298115/lbragile]正在寻找一个更详细的答案对于这个问题: 我将感谢一个 MWE 代码片段,它完成了问题中给定示例的示例输出。 我在网上搜索,找不到任何我想做的事情。 我想保存一个 numpy 数组作为图像,但不是有一个彩色图像,我想在相应的网格位置的像素值的黑白表示。 例如: 将 numpy 作为 np 导入 X = np.array ([1,2],[3,4]]) 打印 (x) #[[1 2] #[3 4]] 我想将其保存为图像 (。PNG),如下所示: expected output [https://i.stack.imgur.com/fCrb1.png] [https://i.stack.imgur.com/fCrb1.png] 我目前的代码创建了一个网格,并将数字放在里面,但是很难调整所有内容,使其在研究论文中呈现出来。 因此,与其发布我过于复杂的代码,我想知道 ……

共3个回答,已解决, 标签: python numpy
将 numpy 数组的组名映射到索引的最快方法是什么?

我正在使用 Lidar 的 3D pointcloud。这些点是由看起来像这样的 numpy 数组给出的: 点数 = np。阵列 ([61651921,416326074,39805],[61605255 厘米,416360555 厘米,41124],[61664810 厘米,416313743 厘米,39900],[61664837 厘米,416313749 厘米,39910],[61674456 厘米,416316663 厘米, 39503],[61651933,416326074,39802],[61679969,416318049,39500],[61674494,416316677,39508],[61651908,416326079,39800],[61651908 厘米,416326087 厘米,39802],[61664845 厘米,416313738 厘米,39913],[61674480 厘米,416316668 厘米,39503],[61679996 厘米,416318047 厘米,39510 厘米] [61605290, 416360572,41118],[61605270,4163 ……

共3个回答,已解决, 标签: python numpy hash grouping lidar
使用 numpy 矢量化检查熊猫列中的参考列表

我有一个参考列表 Ref = ['september','august','july','june','may','april','march'] 和一个数据帧 Df = pd.DataFrame ({'month _ list': [['july'],['august'],['july','june'],['may','april','march']]}) Df Month_List 0 【 7月】 1 [8月] 2 [7月,6月] 3 [5 月,4月,3 月] 我想检查引用列表中的哪些元素出现在每行中,并转换为二进制列表 我可以使用apply Def convert_month_to_binary (ref,lst): S = pd 系列 (参考) 返回 s.isin (lst).astype (int).tolist () Df ['binary _ Month_List'] = df ['month _ list']。应用 (λ x: convert_month_to_binary (ref,x)) Df Month_List Binary_Month_List 0 【 7月】【 ……

共3个回答,已解决, 标签: python pandas numpy
通过成对求和,我需要多少个术语才能得到一个明显错误的结果?

使用给定的 fp 数种类,比如 float16,直接构造完全错误的结果。例如,使用 python/numpy: 将 numpy 作为 np 导入 一 = np.float16 (1) Ope = np.nextafter (一,一一) Np.array ((ope,一,一,一)).cumsum () # Array ([1.001,2。,1。,0。],dtype = float16) 在这里,我们使用cumsum to force naive summation. Left to its own devices numpy 会使用不同的求和顺序,产生更好的答案: Np.array ((ope,一,一,一)).sum () 0.000977 以上是基于取消。为了排除这类例子,让我们只允许非负项。对于天真的求和来说,给出非常错误的求和的例子仍然很容易。以下是 10 ^ 4 个相同的术语,每个术语等于 10 ^-4: Np.full (10 * * 4,10 * *-4,np.float16).cumsum () # Array ([1.0e-04,2.0e-04,3.0e-04,.,2.5e-0 ……

共3个回答,已解决, 标签: python algorithm numpy floating-point sum
如何有效地展开矩阵的值与小块?

我有一个矩阵 M , 其中的值为 0 N 。我想展开这个矩阵来创建一个新的矩阵, A 其中每个子矩阵 A[i, :, :] 表示 m = = = I 是否。 下面的解决方案使用循环。 # Example Setup import numpy as np np.random.seed(0) N = 5 M = np.random.randint(0, N, size=(5,5)) # Solution with Loop A = np.zeros((N, M.shape[0], M.shape[1])) for i in range(N): A[i, :, :] = M == i 这将产生: M array([[4, 0, 3, 3, 3], [1, 3, 2, 4, 0], [0, 4, 2, 1, 0], [1, 1, 0, 1, 4], [3, 0, 3, 0, 2]]) M.shape # (5, 5) A array([[[0, 1, 0, 0, 0], [0, 0, 0, 0, 1], ……

共3个回答,已解决, 标签: python arrays numpy
&ldquo;不推荐使用类型的同义词; 在 numpy 的未来版本中,它将被理解为 (类型,(1,)/(1,) 类型。

我安装了 TensorFlow 1.10.1,但是当我试图导入 TensorFlow 时,它说我需要 TensorFlow 1.10.0 版本。因此,我安装了它,现在我收到以下警告: > 导入 tensorflow C: \ 用户 \ PC \ Anaconda3 \ envs \ tut \ lib \ 站点包 \ tensorflow \ python \ framework \ dtypes。 py: 516: FutureWarning: 不推荐将 (类型,1) 或 “1 类型” 作为类型的同义词传递; 在 numpy 的未来版本中,它将被理解为 (1 、)/'(1 、) 型'。 _ Np_qint8 = np.dtype ([(“qint8”,np.int8,1))]) C: \ 用户 \ PC \ Anaconda3 \ envs \ tut \ lib \ 站点包 \ tensorflow \ python \ framework \ dtypes。 py: 517: FutureWarning: 不推荐将 (类型,1) 或 “1 类型” 作为类型的同义词传递; 在 numpy 的未来版本中, ……

共3个回答,已解决, 标签: python python-3.x numpy tensorflow artificial-intelligence
关于多线程的熊猫和 Numpy 中奇怪的错误

默认情况下,Numpy 的大部分函数将启用多线程。 例如,我在 8 核英特尔 cpu 工作站上工作,如果我运行脚本 将 numpy 导入为 np X = np.random (1000000) 对于 i 范围 (100000): Np.sqrt (x) Linuxtop will show 800% cpu usage during running like enter image description here [https://i.stack.imgur.com/2x85C.png] [https://i.stack.imgur.com/2x85C.png] Which means numpy automatically detects that my workstation has 8 cores, and np.sqrt自动使用所有 8 个内核来加速计算。 然而,我发现了一个奇怪的错误。如果我运行一个脚本 将 numpy 导入为 np 将熊猫作为 pd 导入 Df = pd.DataFrame (np.random ((10,10) Df + df X = np.random (10 ……

共3个回答,已解决, 标签: python pandas numpy
为什么 (inf 0j) * 1 对 inf nanj 进行评估?

> 从 numpy import inf,nan > Z = (inf 0j) * 1 (Inf nanj) 为什么?这在我的代码中引起了一个严重的错误。 为什么不是1 the multiplicative identity, giving (inf 0j)? ……

共2个回答,已解决, 标签: python numpy nan ieee-754
用 Python 、 np.linalg 求解线性方程组 AX = B。

我试图求解线性方程 AX = B,其中 A,X,B 是矩阵。 我已经尝试使用Np.linalg.求解的功能Numpy但结果似乎是错的。 示例: 矩阵 A 【 9 一 8 】 [3 2 5] [1 6 5] 矩阵 B 【 7 0 5 】 【 7 8 4 】 [5 6 7] 为了解决 X,我使用了: X = np.linalg.求解 (A,B) 结果是: X 【 1.17521368-0.17948718 0.40598291 】 【 0.20512821-0.30769231 0.74358974 】 【-0.56410256-0.15384615 1.20512821 】 但是,如果我试图通过将 A 乘以 X 来验证结果,结果除了 B 之外什么都没有: B. 【 5.40598291-2.02564103 8.86752137 】 【 7.61111111-4.33333333 13.61111111 】 【 3.15811966-3.82051282 14.92735043 】 如果我使用这个: Np.matmul (B,np.linalg.inv (A)) 我得到了相同的结 ……

数字. cos 在某些数字上的工作时间要长得多

LDDR: numpy.cos()在特定数字上工作时间延长 30% (例如, 正好是 24000.0)。添加一个小增量 (+ 0.01) 导致 numpy.cos() 像往常一样工作。 我不知道为什么。 -------------------------------------------------------------------------------- 我在一起工作时偶然发现了一个奇怪 numpy 的问题。我正在检查缓存工作, 不小心做了一个错误的图形-时间 numpy.cos(X) 取决于. X 这是我修改后的代码 (从我的木星笔记本复制): import numpy as np import timeit st = 'import numpy as np' cmp = [] cmp_list = [] left = 0 right = 50000 step = 1000 # Loop for additional average smoothing for _ in range(10): cmp_list = [] # Calculate np.cos dependi ……

共1个回答,已解决, 标签: python numpy