零服务器部署 AI 应用：Lambda + Bedrock 全流程实战记录-尧图企业网站定制

é›¶æœåŠ¡å™¨éƒ¨ç½² AI åº”ç”¨ï¼šLambda Bedrock å¨æµç¨‹å®žæˆ˜è®°å½•æŠ˜è¾äº†ä¸¤å¤©ï¼Œç»ˆäºŽæŠŠä¸€å¥— Serverless AI åº”ç”¨è·‘é€šäº†ã€‚ä»Ž Lambda å‡½æ•°åˆ° Bedrock æ¨¡åž‹è°ƒç”¨ï¼Œè¸©äº†ä¸å°‘å‘ï¼Œè¿™é‡Œå®Œæ•´è®°å½•ä¸‹æ¥ã€‚ä¸ºä»€ä¹ˆè¦ç”¨ Serverless æž AIè¯´å®žè¯ï¼Œä¸€å¼€å§‹æˆ‘ä¹Ÿæ²¡æƒ³ç”¨ Lambdaã€‚æˆ‘ä»¬å›¢é˜Ÿæœ‰ä¸ªéœ€æ±‚â€”â€”åšä¸€ä¸ªå†éƒ¨çŸ¥è¯†é—®ç”å·¥å·ï¼Œç”¨å¤§æ¨¡åž‹æ¥å›žç”æŠ€æœ¯é—®é¢˜ã€‚æœ€åˆçš„æƒ³æ³•æ˜¯èµ·ä¸ª EC2 è·‘ FastAPIï¼Œä½†ç®—äº†ä¸‹æˆæœ¬ï¼š24 å°æ—¶æŒ‚ç€ EC2ï¼šå°±ç®—ç”¨ t3.mediumï¼Œä¸€ä¸ªæœˆä¹Ÿè¦å‡ åç¾Žé‡‘å®žé™ä½¿ç”¨çŽ‡ï¼šå·¥ä½œæ—¶é—´å¤§æ¦‚ 8 å°æ—¶ï¼Œå‘¨æœ«åŸºæœ¬æ²¡äººç”¨çœŸæ£åœ¨å¤„ç†è¯·æ±‚çš„æ—¶é—´ï¼šå¯èƒ½ä¸€å¤©åŠ èµ·æ¥å°±å‡ åˆ†é’Ÿè¿™ä¸ªåˆ©ç”¨çŽ‡ä¹Ÿå¤ªä½Žäº†ã€‚åŽæ¥æƒ³åˆ° Lambdaâ€”â€”æŒ‰è°ƒç”¨æ¬¡æ•°æ”¶è´¹ï¼Œæ²¡è¯·æ±‚å°±æ˜¯ $0ï¼Œå®Œç¾Žç¬¦åˆè¿™ä¸ªåœºæ™¯ã€‚æŠ€æœ¯æž¶æž„é•¿ä»€ä¹ˆæ ·æ•´ä¸ªé“¾è·¯å¶å®žä¸å¤æ‚ï¼šç”¨æˆ· â†’ API Gateway â†’ Lambda â†’ Bedrock (Claude) â†’ è¿”å›žç»“æžœç”¨åˆ°çš„äºšé©¬é€Šäº‘ç§‘æŠ€æœåŠ¡ï¼šAPI Gatewayï¼šHTTP å¥å£ï¼Œå¤„ç†è·¯ç”±å’Œè®¤è¯Lambdaï¼šä¸šåŠ¡é€»è¾‘ï¼ŒPython 3.12 runtimeBedrockï¼šè°ƒç”¨ Claude 3.5 Sonnet æ¨¡åž‹IAMï¼šæƒé™æŽ§åˆ¶ï¼ŒLambda éœ€è¦bedrock:InvokeModelæƒé™ç¬¬ä¸€æ¥ï¼šå†™ Lambda å‡½æ•°åˆæŠŠæ ¸å¿ƒé€»è¾‘è·‘é€šã€‚æ–°å»ºä¸€ä¸ªlambda_function.pyï¼šimportjsonimportboto3 bedrockboto3.client(bedrock-runtime,region_nameus-east-1)deflambda_handler(event,context):# ä»Žè¯·æ±‚ä¸æ‹¿åˆ°ç”¨æˆ·é—®é¢˜bodyjson.loads(event.get(body,{}))questionbody.get(question,)ifnotquestion:return{statusCode:400,body:json.dumps({error:é—®é¢˜ä¸èƒ½ä¸ºç©º})}# è°ƒç”¨ Bedrock Clauderesponsebedrock.invoke_model(modelIdanthropic.claude-3-5-sonnet-20241022-v2:0,contentTypeapplication/json,acceptapplication/json,bodyjson.dumps({anthropic_version:bedrock-2023-05-31,max_tokens:2048,messages:[{role:user,content:question}]}))resultjson.loads(response[body].read())answerresult[content][0][text]return{statusCode:200,headers:{Content-Type:application/json},body:json.dumps({answer:answer})}è¿™æ®µä»£ç å°±åšäº†ä¸‰ä»¶äº‹ï¼šä»Ž API Gateway ä¼ è¿‡æ¥çš„ event é‡Œæ‹¿é—®é¢˜è°ƒ Bedrock çš„ Claude æ¨¡åž‹æŠŠå›žç”è¿”å›žåŽ»ç¬¬äºŒæ¥ï¼šéç½® IAM æƒé™Lambda æ‰§è¡Œè§’è‰²éœ€è¦è¿™ä¸¤ä¸ªæƒé™ï¼š{Version:2012-10-17,Statement:[{Effect:Allow,Action:[bedrock:InvokeModel,bedrock:InvokeModelWithResponseStream],Resource:arn:aws:bedrock:us-east-1::foundation-model/anthropic.claude-3-5-sonnet-*},{Effect:Allow,Action:[logs:CreateLogGroup,logs:CreateLogStream,logs:PutLogEvents],Resource:arn:aws:logs:*:*:*}]}è¿™é‡Œæœ‰ä¸ªå‘â€”â€”Bedrock æ¨¡åž‹çš„ ARN æ ¼å¼è·Ÿå¶ä»–æœåŠ¡ä¸å¤ªä¸€æ ·ï¼Œè´¦å·é‚£æ®µæ˜¯ç©ºçš„ï¼ˆä¸¤ä¸ªå†’å·ä¹‹é—´æ²¡ä¸œè¥¿ï¼‰ã€‚ç¬¬ä¸€æ¬¡éçš„æ—¶å€™å†™æˆäº†arn:aws:bedrock:us-east-1:123456789:foundation-model/...ï¼Œç»“æžœä¸€ç›´æŠ¥ AccessDeniedï¼ŒæŸ¥äº†åŠå¤©æ‰å‘çŽ°ã€‚ç¬¬ä¸‰æ¥ï¼šAPI Gateway é›†æˆç”¨ HTTP APIï¼ˆä¸æ˜¯ REST APIï¼‰ï¼Œæ›´ä¾¿å®œæ›´å¿«ï¼š# åˆ›å»º HTTP APIaws apigatewayv2 create-api\--nameai-qa-api\--protocol-type HTTP# åˆ›å»º Lambda é›†æˆaws apigatewayv2 create-integration\--api-id YOUR_API_ID\--integration-type AWS_PROXY\--integration-uri arn:aws:lambda:us-east-1:ACCOUNT:function:ai-qa\--payload-format-version2.0# åˆ›å»ºè·¯ç”±aws apigatewayv2 create-route\--api-id YOUR_API_ID\--route-keyPOST /askè¸©å‘è®°å½•å‘ 1ï¼šLambda è¶æ—¶Lambda é»˜è®¤è¶æ—¶æ˜¯ 3 ç§’ï¼Œä½† Bedrock è°ƒ Claude ä¸€æ¬¡å“åº”å¯èƒ½è¦ 5-15 ç§’ã€‚ç¬¬ä¸€æ¬¡æµ‹è¯•ç›´æŽ¥è¶æ—¶äº†ã€‚è§£å†³ï¼šæŠŠ Lambda è¶æ—¶æ”¹æˆ 30 ç§’ã€‚åœ¨æŽ§åˆ¶å°æ”¹æˆ–è€ç”¨ CLIï¼šaws lambda update-function-configuration\--function-name ai-qa\--timeout30å‘ 2ï¼šå†·å¯åŠ¨å»¶è¿ŸLambda å†·å¯åŠ¨ Bedrock é¦–æ¬¡è°ƒç”¨ï¼Œç¬¬ä¸€æ¬¡è¯·æ±‚å¯èƒ½è¦ç‰ 10 ç§’ã€‚åŽé¢å°±æ£å¸¸äº†ã€‚è§£å†³æ–¹æ¡ˆï¼šéç½® Provisioned Concurrencyï¼ˆé¢„ç½®å¹¶å‘ï¼‰ï¼Œä¿æŒå‡ ä¸ªå®žä¾‹å¸¸çƒæˆ–è€ç”¨ CloudWatch Events å®šæ—¶ pingï¼Œä¿æŒå‡½æ•°æ¸©çƒaws lambda put-provisioned-concurrency-config\--function-name ai-qa\--qualifierprod\--provisioned-concurrent-executions2å‘ 3ï¼šè¿”å›žä½“å¤§å°é™åˆ¶API Gateway åŒæ¥å“åº”ä¸Šé™ 10MBï¼ŒLambda è¿”å›žä¸Šé™ 6MBã€‚ä¸€èˆ¬é—®ç”æ²¡é—®é¢˜ï¼Œä½†å¦‚æžœè®©æ¨¡åž‹ç”Ÿæˆé•¿æ–‡ï¼Œè¦æ³¨æ„è¿™ä¸ªé™åˆ¶ã€‚å‘ 4ï¼šBedrock åŒºåŸŸä¸æ˜¯æ‰€æœ‰åŒºåŸŸéƒ½æ”¯æŒ Bedrockã€‚ç›®å‰us-east-1å’Œus-west-2æ¨¡åž‹æœ€å¨ã€‚å¦‚æžœä½ çš„ Lambda åœ¨ä¸œäº¬ï¼ˆap-northeast-1ï¼‰ï¼Œéœ€è¦è·¨åŒºåŸŸè°ƒç”¨ Bedrockï¼šbedrockboto3.client(bedrock-runtime,region_nameus-east-1)è·¨åŒºåŸŸè°ƒç”¨ä¼šå¢žåŠ 50-100ms å»¶è¿Ÿï¼Œä½†å¯¹äºŽ AI åº”ç”¨æ¥è¯´è¿™ä¸ªå»¶è¿ŸåŸºæœ¬å¯ä»¥å¿½ç•¥ã€‚æˆæœ¬å¯¹æ¯”è·‘äº†ä¸€ä¸ªæœˆï¼Œå®žé™æ•°æ®ï¼šæ–¹æ¡ˆæœˆæˆæœ¬EC2 t3.medium 24/7~$30Lambda API Gateway~$3Lambda æ–¹æ¡ˆçœäº† 90%ã€‚å½“ç„¶ï¼Œå¦‚æžœä½ çš„ QPS å¾ˆé«˜ï¼ˆæ¯”å¦‚æ¯ç§’ä¸Šç™¾æ¬¡è¯·æ±‚ï¼‰ï¼ŒLambda åè€Œå¯èƒ½æ›´è´µã€‚æŒ‰éœ€é€‰æ‹©å°±å¥½ã€‚Lambda è®¡è´¹é€»è¾‘ï¼šæ¯æœˆå‰ 100 ä¸‡æ¬¡è¯·æ±‚åè´¹ä¹‹åŽ $0.20/ç™¾ä¸‡æ¬¡å†å˜æŒ‰ GB-ç§’è®¡è´¹ï¼š$0.0000166667/GB-ç§’ä»¥ 256MB å†å˜ã€å¹³å‡æ‰§è¡Œ 5 ç§’æ¥ç®—ï¼šæ¯æ¬¡è°ƒç”¨æˆæœ¬ â‰ˆ $0.0000208ä¸€å¤© 100 æ¬¡ $0.002ä¸€ä¸ªæœˆ â‰ˆ $0.06Bedrock è°ƒç”¨è´¹æ˜¯å¦ç®—çš„ï¼ˆæŒ‰ token è®¡è´¹ï¼‰ï¼Œè¿™é‡Œä¸å±•å¼€ã€‚è¿›é˜¶ï¼šæµå¼å“åº”ç”¨æˆ·ç‰ 10 ç§’çœ‹åˆ°å®Œæ•´å›žç”ï¼Œä½“éªŒä¸å¥½ã€‚æ”¹æˆæµå¼å“åº”ï¼Œè¾¹ç”Ÿæˆè¾¹è¿”å›žï¼šdeflambda_handler(event,context):bodyjson.loads(event.get(body,{}))questionbody.get(question,)responsebedrock.invoke_model_with_response_stream(modelIdanthropic.claude-3-5-sonnet-20241022-v2:0,contentTypeapplication/json,acceptapplication/json,bodyjson.dumps({anthropic_version:bedrock-2023-05-31,max_tokens:2048,messages:[{role:user,content:question}]}))# æµå¼å¤„ç†éœ€è¦ Lambda Response Streamingchunks[]forevent_chunkinresponse[body]:chunkjson.loads(event_chunk[chunk][bytes])ifchunk[type]content_block_delta:chunks.append(chunk[delta][text])return{statusCode:200,body:json.dumps({answer:.join(chunks)})}çœŸæ£çš„æµå¼éœ€è¦éåˆ Lambda Response Streamingï¼ˆå‡½æ•° URL RESPONSE_STREAMï¼‰æˆ– WebSocket APIã€‚ä¸Šé¢çš„å†™æ³•åªæ˜¯æŠŠæµå¼æŽ¥æ”¶åˆ°çš„å†å®¹æ‹¼èµ·æ¥ä¸€æ¬¡è¿”å›žï¼Œé€‚åˆç®€å•åœºæ™¯ã€‚æ€»ç»“Lambda Bedrock æ AI åº”ç”¨ï¼Œæ ¸å¿ƒä¼˜åŠ¿å°±ä¸€ä¸ªå—ï¼šçœã€‚çœé’±ï¼ˆæŒ‰è°ƒç”¨è®¡è´¹ï¼‰ã€çœå¿ƒï¼ˆä¸ç”¨ç®¡æœåŠ¡å™¨ï¼‰ã€çœæ—¶ï¼ˆå‡ ä¸ªæ–‡ä»¶å°±èƒ½éƒ¨ç½²ï¼‰ã€‚é€‚åˆçš„åœºæ™¯ï¼šå†éƒ¨å·¥å·ã€é—®ç”æœºå™¨äººä½Žé¢‘è°ƒç”¨çš„ AI åŠŸèƒ½ï¼ˆæ¯”å¦‚æ¯å¤©å‡ ç™¾æ¬¡ï¼‰åŽŸåž‹éªŒè¯ã€å¿«é€Ÿä¸Šçº¿ä¸é€‚åˆçš„åœºæ™¯ï¼šé«˜å¹¶å‘å®žæ—¶å¯¹è¯ï¼ˆWebSocket åœºæ™¯å»ºè®®ç”¨ ECS/EKSï¼‰éœ€è¦ GPU æŽ¨ç†çš„è‡ªå®šä¹‰æ¨¡åž‹å¦‚æžœä½ ä¹Ÿåœ¨è€ƒè™‘æ€Žä¹ˆä½Žæˆæœ¬ä¸Šçº¿ä¸€ä¸ª AI åŠŸèƒ½ï¼ŒLambda Bedrock å¯ä»¥è¯•è¯•ã€‚ðŸ“Œ å®Œæ•´ä»£ç å’Œ CloudFormation æ¨¡æ¿æˆ‘æ”¾åœ¨æ–‡æœ«ï¼Œæœ‰éœ€è¦çš„ç›´æŽ¥æ‹¿èµ°ã€‚æ‰€æœ‰ä»£ç åŸºäºŽäºšé©¬é€Šäº‘ç§‘æŠ€ Lambda Python 3.12 è¿è¡Œæ—¶æµ‹è¯•é€šè¿‡ã€‚

相关新闻

负荷自适应分配阶梯变化

AI重构技术生产力：编程、测试与数据分析的前沿突破与未来图景

基于python+vue的大学生社交平台 情感分析平台

软件工程师岗位全景、薪资待遇与发展前景深度解析（2026版）

软件工程师岗位全景解析：从技术栈到职业路径的深度指南

059、NPU的GELU与Swish激活函数：硬件友好性分析

Hutch与Docker集成：容器化部署消息队列服务的完整方案

MenuItemKit完全指南：为UIMenuItem添加图片与闭包支持的终极解决方案

别再为N32G45X的printf发愁了！手把手教你搞定KEIL下串口打印（含MicroLIB切换指南）

程序员生存指南01-2026程序员市场真相：AI时代程序员的“贫富差距“有多夸张？低端岗位暴跌52%，AI岗暴涨8.7倍

HCCL 集合通信库架构剖析——昇腾 NPU 多机多卡训练的通信拓扑与协议栈

西门子S7-1500通过Profinet直连图尔克TBEN-S2 RFID读写头（含128字节通信工程与说明）

陪诊小程序开发玩法分析：全流程就医服务架构、匹配机制与落地方案

从“大通铺”到“写字楼”的链路层进化史

RAG 召回质量治理：用 Go 构建可调试的切片、检索与重排链路

从陌生到熟悉：Royal TSX中文汉化包的体验地图之旅

时延最优化设计

别再重启了！Windows 11下dwm.exe内存飙升，我用Intel官方工具升级显卡驱动搞定

基于python+vue的大学生社交平台情感分析平台