动态

详情 返回 返回

如何通過Python SDK向Collection中插入或更新Doc - 动态 详情

本文介紹如何通過Python SDK向Collection中插入或更新Doc。

説明

  1. 若調用本接口時Doc Id已存在,則等同於更新Doc;
    Doc Id不存在,則等同於插入Doc。
  2. 若調用本接口時不指定Doc Id,則等同於插入Doc,DashVector會自動生成Doc Id,並在返回結果中攜帶id信息。

前提條件

  • 已創建Cluster
  • 已獲得API-KEY
  • 已安裝最新版SDK

接口定義

Python示例:

Collection.upsert(
    docs: Union[Doc, List[Doc], Tuple, List[Tuple]],
    partition: Optional[str] = None,
    async_req: False
) -> DashVectorResponse

使用示例

説明

  1. 需要使用您的api-key替換示例中的YOUR_API_KEY、您的Cluster Endpoint替換示例中的YOUR_CLUSTER_ENDPOINT,代碼才能正常運行。
  2. 本示例需要參考新建Collection-使用示例提前創建好名稱為quickstart的Collection。

Python示例:

import dashvector
from dashvector import Doc
import numpy as np

client = dashvector.Client(
    api_key='YOUR_API_KEY',
    endpoint='YOUR_CLUSTER_ENDPOINT'
)
collection = client.get(name='quickstart')

插入或更新Doc

Python示例:

# 通過Doc對象upsert
ret = collection.upsert(
    Doc(
        id='1',
        vector=[0.1, 0.2, 0.3, 0.4]
    )
)
# 判斷upsert是否成功
assert ret

# 簡化形式:通過Tuple upsert
ret = collection.upsert(
    ('2', [0.1, 0.1, 0.1, 0.1])               # (id, vector)
)

插入或更新不帶有Id的Doc

Python

# 通過Doc對象upsert
ret = collection.upsert(
    Doc(vector=[0.1, 0.2, 0.3, 0.4])
)
# 簡化形式:通過Tuple upsert
ret = collection.upsert(
    ([0.1, 0.1, 0.1, 0.1],)          
)

插入或更新帶有Fields的Doc

Python示例:

# upsert單條數據,並設置Fields Value
ret = collection.upsert(
    Doc(
        id='3',
        vector=np.random.rand(4),
        fields={
            # 設置創建Collection時預定義的Fileds Value
            # name:str, weight:float, age:int, id:long
            'name': 'zhangsan', 'weight':70.0, 'age':30, 'id':1234567890,
            # 設置Schema-Free的Field & Value
            'anykey1': 'str-value', 'anykey2': 1,
            'anykey3': True, 'anykey4': 3.1415926
        }
    )
)

# upsert單條數據,並設置Fields Value
ret = collection.upsert(
    ('4', np.random.rand(4), {'foo': 'bar'})  # (id, vector, fields)
)

批量插入或更新Doc

Python示例:

# 通過Doc對象,批量upsert 10條數據
ret = collection.upsert(
    [
        Doc(id=str(i+5), vector=np.random.rand(4)) for i in range(10)
    ]
)

# 簡化形式:通過Tuple,批量upsert 3條數據
ret = collection.upsert(
    [
        ('15', [0.2,0.7,0.8,1.3], {'age': 20}),
        ('16', [0.3,0.6,0.9,1.2], {'age': 30}),
        ('17', [0.4,0.5,1.0,1.1], {'age': 40})
    ]                                         # List[(id, vector, fields)]
)

# 判斷批量upsert是否成功
assert ret

異步插入或更新Doc

Python示例:

# 異步批量upsert 10條數據
ret_funture = collection.upsert(
    [
        Doc(id=str(i+18), vector=np.random.rand(4), fields={'name': 'foo' + str(i)}) for i in range(10)
    ],
    async_req=True
)
# 等待並獲取異步upsert結果
ret = ret_funture.get()

插入或更新帶有Sparse Vector的Doc

Python示例:

ret = collection.upsert(
    Doc(
        id='28',
        vector=[0.1, 0.2, 0.3, 0.4],
        sparse_vector={1:0.4, 10000:0.6, 222222:0.8}
    )
)
user avatar zhidechaomian_detxs7 头像 xzqcsj 头像 openfuyao 头像 k21vin 头像 u_16640205 头像 u_15316473 头像 sovitjs 头像 u_16827017 头像 histry 头像 u_15214399 头像 huikaichedemianbao 头像 hashdata 头像
点赞 35 用户, 点赞了这篇动态!
点赞

Add a new 评论

Some HTML is okay.