通过随机抽样其他列数据创建新列

我想通过随机采样其余列中的数据来创建一个新列。 请考虑具有 "N" 列的数据框, 如下所示: |---------------------|------------------|---------------------| | Column 1 | Column 2 | Column N | |---------------------|------------------|---------------------| | 0.37 | 0.8 | 0.0 | |---------------------|------------------|---------------------| | 0.0 | 0.0 | 0.8 | |---------------------|------------------|---------------------| 生成的数据框 ……

共4个回答,已解决, 标签: python pandas
如何使用熊猫获得包括每一个组合的计数

我正在想知道顾客一起买的是什么组合的服装。我可以计算出确切的组合, 但我想不出的问题是包括组合 + 其他的计数。 例如, 我有: Cust_num Item Rev Cust1 Shirt1 $40 Cust1 Shirt2 $40 Cust1 Shorts1 $40 Cust2 Shirt1 $40 Cust2 Shorts1 $40 这将导致: Combo Count Shirt1,Shirt2,Shorts1 1 Shirt1,Shorts1 2 我能做的最好的是独特的组合: Combo Count Shirt1,Shirt2,Shorts1 1 Shirt1,Shorts1 1 我试过了: df = df.pivot(index='Cust_num',columns='Item').sum() df[df.notnull()] = "x" df = df.loc[:,"Shirt1":].replace("x", ……

共4个回答,已解决, 标签: python pandas
如何有效地展开矩阵的值与小块?

我有一个矩阵 M , 其中的值为 0 N 。我想展开这个矩阵来创建一个新的矩阵, A 其中每个子矩阵 A[i, :, :] 表示 m = = = I 是否。 下面的解决方案使用循环。 # Example Setup import numpy as np np.random.seed(0) N = 5 M = np.random.randint(0, N, size=(5,5)) # Solution with Loop A = np.zeros((N, M.shape[0], M.shape[1])) for i in range(N): A[i, :, :] = M == i 这将产生: M array([[4, 0, 3, 3, 3], [1, 3, 2, 4, 0], [0, 4, 2, 1, 0], [1, 1, 0, 1, 4], [3, 0, 3, 0, 2]]) M.shape # (5, 5) A array([[[0, 1, 0, 0, 0], [0, 0, 0, 0, 1], ……

共3个回答,已解决, 标签: python arrays numpy
在巨蟒请求中处理磅符号 (#)

我正在使用请求来编译自定义 URL, 其中一个参数包含磅符号。任何人都可以解释如何在不对磅符号进行编码的情况下传递参数吗? 这将返回正确的 CSV 文件 results_url = 'https://baseballsavant.mlb.com/statcast_search/csv?all=true&hfPT=&hfAB=&hfBBT=&hfPR=&hfZ=&stadium=&hfBBL=&hfNewZones=&hfGT=R%7C&hfC=&hfSea=2019%7C&hfSit=&player_type=batter&hfOuts=&opponent=&pitcher_throws=&batter_stands=&hfSA=&game_date_gt=&game_date_lt=&hfInfield=&team=&position=&hfOutfield=&hfRO=&home_road=&hfFlag=&hfPull=&metric_1=&hfInn=&min_pitches=0&min_results=0&group_by=name&sort_col=pitches&player_event_s ……

共3个回答, 标签: python python-requests
如何使用巨蟒将浮点数舍入到固定的十进制部分

我有一些价格, 如 5.35, 10.91, 15.55, 我圆两个小数使用 Price = "{:.2f}".format(Price) 但我怎么能让他们是圆的基础上0.50 和 0.50, 并有 5.50、10.90、15.50 谢谢 ……

共3个回答, 标签: python
没有错误, 但当我运行它, 它显示一个白色屏幕

我用 trinket. io 做了一个相当大的代码。后来我做了一个商店, 然后保存功能。有一次, 我做了一个保存功能, 代码停止工作。 我已经尝试修复拼写错误的缩进, 将代码放入新的巨蟒程序。 def main(): reward = 0 patt = 20 pdef = 10 php = 35 pgold= 0 pgold = pgold + reward name = input("what is your name") print('''You are ''' +name+ ''' and you're trying to escape from the zoo but OUTTA NOWHERE A...''') save() def save(): import random import time name = input("what is your name") print('''You are ''' +name+ ''' and you're trying to escape from the zoo but O ……

共2个回答, 标签: python
当接收 "ValueError: 没有足够的值解包 (预期 2, 得到 1)" 时, 如何强制程序忽略并继续?

我使用 Python (3) 和 OpenCV (3.3) 在网络摄像头上运行实时对象检测, 使用示例图像, 该图像与视频流的功能匹配。我已经得到了它的工作使用 SIFT/SURF, 但试图使用 ORB 算法。 在某些情况下, 我收到以下错误, 导致程序崩溃: for i, (m, n) in enumerate(matches): ValueError: not enough values to unpack (expected 2, got 1) 我理解它崩溃背后的原因, 有时图像之间有很好的匹配, 有时没有, 造成不匹配。 我的问题是, 如何强制程序忽略并跳过没有足够值的情况并继续运行。 有问题的主要代码领域: for i, (m, n) in enumerate(matches): if m.distance < 0.7*n.distance: good.append(m) 示例 "匹配" 输出: [[, ], [, ], [, ], [, ], etc etc 完整代码: import numpy as np import c ……

共2个回答, 标签: python opencv enumerate orb flann
如何为方法创建装饰器

我想装饰一个简单的方法, 运行 5次: def do_5(f): @wraps(f) def wr(*a,**kw): i = 0 while i < 5: f(a,kw) i += 1 return wr class a(object): @do_5 def f(self, x): print x 然而, 这只使 func 打印 x 实际上 {} 是1 使用 ipdb, 我看到 self 这是第一个, *a 所以我尝试将包装更改为 In [37]: def do_5(f): ...: @wraps(f) ...: def wr(*a,**kw): ...: self, other_args = a[0], a[1:] ...: i = 0 ...: while i < 5: ...: ……

共2个回答,已解决, 标签: python python-2.7 decorator
Python 中可用处理器的数量 [重复]

这个问题在这里已经有了答案: * 如何使用巨蟒13个答案找出 Cpu 的数量 [/questions/1006289/how-to-find-out-the-number-of-cpus-using-python] 在 Java 中, 这将返回可用处理器的数量: Runtime.getRuntime().availableProcessors() 在决定要创建多少个长时间运行的线程时, 这很方便。 Python 中是否有等效函数可调用? ……

共2个回答,已解决, 标签: java python multithreading python-multithreading
我可以创建克隆的克隆吗?

我已经用约翰·泽尔的教科书《 Python 编程》做了一些功课。我使用作为书籍的附加材料提供的图形库。 我的问题: 我可以创建一个 Point 的克隆, 然后在该克隆之后再次移动该克隆 (来自该克隆) 并移动该克隆吗? 还是 "克隆" 被禁止, 我必须从原来的点创建第二个克隆? 谢谢你的帮助! ……

共1个回答, 标签: python
更改小时和非存在时间错误: 2019-03-31 01:50:2445 5000

这是我的密码 data = result["Document"] df = pd.DataFrame(data) df["Created"] = pd.to_datetime(df["Created"]) df["Created"] = pd.to_datetime(df["Created"],errors='coerce').dt.tz_localize('Europe/London').dt.tz_convert('Europe/Paris') #print(df)hour df['Created'] = df['Created'].dt.date df["Barcode"] = df["Barcode"].astype(str) fig, ax = plt.subplots() myFmt = mdates.DateFormatter('%Y-%m-%d %H:%M') ax.xaxis.set_major_formatter(myFmt) df1 = df.groupby(["Created"])["Tag"].count().reset_index() df2 = df[df["Tag ……

共1个回答, 标签: python timezone
Python: 下一个循环

我想使用 next 跳过从生成器返回的一个或多个项目。下面是一个简化的示例, 旨在跳过每个循环的一个项目 (在实际使用中, 我将 n 测试, 并根据结果, next() 可能会重复, 并且生成器来自我不控制的包): def gen(): for i in range(10): yield i for g in gen(): n = next(gen()) print(g, n) 我预计结果会是 0 1 2 3 等。 相反, 我得到了 0 0 1 0 等。 我做错什么了? ……

共1个回答,已解决, 标签: python generator next
如何将 JSON 文件从 GET 请求转换为熊猫数据框?

我试图将从巨蟒 GET 请求 (请求库) 获得的 json 转换为熊猫数据框。 我已经尝试了一些其他的解决方案, 在这个问题上, 包括 json _ 规范化, 但它似乎没有起作用。数据框架显示为带有字典的单个列。 response = requests.get(myUrl, headers=head) data = response.json() #what now? 给了我以下的 json: "data": [ { "timestamp": "2019-04-10T11:40:13.437Z", "score": 87, "sensors": [ { "comp": "temp", "value": 20.010000228881836 }, { "comp": "humid", ……

共1个回答, 标签: python json pandas api
拆分列中的行和数据框的绘图图。Python

我的数据集包含天和小时的数据 time slot hr_slot location_point 2019-01-21 00:00:00 0 34 2019-01-21 01:00:00 1 564 2019-01-21 02:00:00 2 448 2019-01-21 03:00:00 3 46 . . . . 2019-01-22 23:00:00 23 78 2019-01-22 00:00:00 0 34 2019-01-22 01:00:00 1 165 2019-01-22 02:00:00 2 65 2019-01-22 03:00:00 3 156 . . . . 2019-01-22 23:00:00 23 ……

共1个回答,已解决, 标签: python pandas
函数仅由一个线程执行, 而不是多个

我编写了一个巨蟒脚本, 将市场数据导入到 MariaDB 数据库中。为了加快导入速度, 我决定使用模块线程。因此, 首先, 函数使用 urls 填充队列, 从中下载数据并将其导入到我的数据库中。不幸的是, 导入函数似乎只由一个线程而不是许多线程处理。 import queue from threading import Thread num_threads = 4 threads = [] urls = queue.Queue() def create_url(): ... getlist of items ... for row in item_list: url = 'https://someurl=' + str(row[0]) urls.put(url) return urls def import_mo(urls): station_id = 60003760 print(worker.getName()) try: mariadb_connection = mariadb.connec ……

共1个回答, 标签: python mysql multithreading queue
如何比较不精确匹配的字符串

我需要比较两个输出字符串, 即原始转录和语音到文本服务的转录。数字通常是以数字格式或以 "四" 或 "4" 等单词的形式写的。考虑到这些不同的转录方法, 如何比较字符串? 到目前为止, 我只是用小写字母转换了两个字符串, 并将每个单词分成一个空格。 #Read the two files and store them in s1_raw and s2_raw with open('original.txt', 'r') as f: s1_raw = f.read() with open('comparison.txt', 'r') as f: s2_raw = f.read() #Transform all letters to minuscule letter s1 = s1_raw.lower() s2 = s2_raw.lower() #Split texts with space as seperator to have a list of words s1_set = s1.split(' ') s2_set = s2.split(' ') #Used later for ……

使用终端安装巨蟒时遇到问题

我按照这些步骤试图安装巨蟒, 但突然我的终端将无法打开。可能是什么问题, 我如何解决它? sudo apt-get update sudo apt-get install python3.6 sudo update-alternatives --install /usr/bin/python3 python3 /usr/bin/python3.5 1 sudo update-alternatives --install /usr/bin/python3 python3 /usr/bin/python3.6 2 sudo update-alternatives --config python3 sudo rm /usr/bin/python3 sudo ln -s python3.5 /usr/bin/python3 ……

共1个回答, 标签: python install sudo
Python 库是否特定

为什么某些 Python 库无法在不同的操作系统上安装。如果我把它与 Java 进行比较, 巨蟒有轮子和鸡蛋 (被丢弃), 一旦我有了 jar, 我就可以在任何系统上运行它, 而不管操作系统是什么, 但在 Python 的情况下, 有一些库在某些特定的操作系统上被明确提到是受支持的。Python 也有一个字节代码, 但为什么它是操作系统特定的 (租方流支持 Ubuntu, 但当我试图在 cnetos 上安装它时, 我得到了错误), 它不应该像 Java 一样工作, 其中我可以下载二进制文件, 简单地执行代码。另外, 当我安装一些库的时候, 它还编译了源代码。我知道 Python (CPython、JPython 等) 有各种各样的实现 我已经阅读了关于 Python 的文章从各种链接, 我发现有用的是 http://www.techdarting.com/2014/04/python-compiled-or-interpreted-language.html [http://www.techdarting.com/2014/04/python-compiled-or-interpreted-language ……

共1个回答, 标签: python tensorflow
为什么在 Python 中就地更换得如此之难?

我有一个非常大的 CSV 文件, 我想直接导入到 Po为格尔与 COPY。为此, CSV 列标题需要匹配数据库列名称。因此, 我需要在非常大的文件的第一行上做一个简单的字符串替换。 有许多答案, 如何做到这一点, 如: * 是否可以就地修改文件中的行? [https://stackoverflow.com/questions/5453267/is-it-possible-to-modify-lines-in-a-file-in-place] * 优化查找和替换 Python 中的大型文件 [https://stackoverflow.com/questions/3800086/optimizing-find-and-replace-over-large-files-in-python] 所有答案都意味着创建大型文件的副本或使用访问整个文件的文件系统级解决方案, 尽管只有第一行是相关的。这使得所有的解决方案都缓慢, 似乎过于过激。 让这项简单的工作如此艰难的根本原因是什么?是否与文件系统相关?还是 Python 特定? ……

共1个回答, 标签: python
基于 TELNET 的 APC PDU CLI 自动化

我在网上看到过很多关于使用 Python pexpect、PHP 等通过 Telnet 登录 APC pexpect 的帖子。但是, 所有示例都是这样的: Python-远程自动化 APC PDU [https://stackoverflow.com/questions/10306410/python-telnet-automation-apc-pdu] https://github.com/quackenbush/APC [https://github.com/quackenbush/APC] 他们使用控制控制台登录, 我认为它没有提供那么多指标。我正在寻找一种方法来自动化命令行界面, 并发送各种命令来检查指标。 我了解到 -c , 通过在登录提示下附加您的密码, 这是可能的: APC_DEFAULT_USER = 'apc' APC_DEFAULT_PASSWORD = 'apc -c' self.child.expect('User Name : ') self.child.send(APC_DEFAULT_USER + '\r\n') self.child.expect('Passw ……

共0个回答, 标签: python telnet pexpect